STATISTIK ILMU SOSIAL

(1)

1

SOPAR M.H

S

T

A

T

I

S

T

I

K

A

I

L

M

U

S

O

S

I

A


(2)

2

Buat Kedua Orang Tuaku


(3)

3

Table of Contents

SEKELUMIT NYANYIAN SUNDA

...5

BAB 1

...7

PENDAHULUAN

...7

BAB 2

... 26

DASAR STATISTIKA DESKRIPTIF

... 26

BAB 3

... 58

PENARIKAN SAMPEL

... 58

BAB 4

... 69

TEORI PROBABILITAS

... 69

BAB 5

... 90

DISTRIBUSI PROBABILITAS

... 90

BAB 6

... 126

DASAR PENGUJIAN HIPOTEIS

... 126

BAB 7

... 148

HIPOTESIS MENGENAI SATU POPULASI DAN

... 148

PENDUGAAN INTERVAL

... 148

BAB 8

... 182

HUBUNGAN SIMETRIK ANTARA DUA PEUBAH

... 182

ASOSIASI DAN KORELASI

... 182

BAB 9

... 218

HUBUNGAN TAKSIMETRIS ANTARA DUA PEUBAH :

... 218

ASOSIASI PERAMALAN DAN REGRESI

... 218

BAB 10

... 254


(4)

4

MISCELENAOUS PROBLEM

... 286

DAFTAR BUKU

... 287

LAMPIRAN

... 290


(5)

5

SEKELUMIT NYANYIAN SUNDA

Ketika aku di Tanah Sunda, tahun 2005,di Program Doktor Ekonomi Padjajaran Bandung, aku ikuti Kuliah Filsafat Ilmu Sosialdari Profesor Fatimah .

Filsafat Ilmu Sosial satu Prasyarat mengajukan Kualifiasi Desertasi Doktor. Statistik Ilmu Sosial juga Prasyarat Kualifikasi Doktor .

Keduanya harus Lulus dengan nilai A .

“Tak ada lagi yang tidak terspesialisasi , hari ini “, demikian Profesor Fatimah, “ tak ada lagi yang bisa menguasai semua Ilmu”

Wetgeinstein, Filsuf Amerika, berkata “ hari ini , tidak seperti dahulu, tak ada lagi Ahli Filsafat yang menguasai Matematika “

Aku tuliskan Buku ini, Statistika Ilmu Sosial untuk Bidang Ilmu-ilmu Sosial.

Berbeda dengan Ilmu alam yang aku geluti selama 25 tahun ; riset-riset ilmu sosial sangat rumit dan sangat susah , tidak seperti riset ilmu alam. Riset ilmu-ilmu sosial berisi beratus-ratus dan beribu-ribu peubah (variable).

Sedang riset ilmu-ilmu alam peubahnya terlalu sedikit .

Kota Medan ,memang sudah sangat ketinggalan zaman Kurikulumnya, sebab masih menggunakan Staistik untuk Jurusan Ilmu Ekonomi.

Jadi belum terspesialisasi ; seperti Dokter dia masih S1, Dokter Umum, belum S2, belum Dokter Spesialisasi.

Staistik hanya boleh diajarkan di Jurusan Matematik ; tapi untuk jurusan lain harus Statitika, metode, bukan sains nya .

Buku Statistika Ilmu Sosial ini dapat digunakan untuk jurusan jurusan Profesi Kependidikan, Manajemen, Akuntansi, Kedokteran , dll.

Sedang untuk Riset Sains , Statistika ini tak dapat digunakan. Untuk Riset sains digunakan Ekonometrik , Ekonofisika, dll.


(6)

6

Metode Kudrat terkecil (Lea st Squares) yang dibahas di sini terlalu sederhana ; untuk lebih rumitnya Anda pelajari di Ekonometrik .

Amat riskan memang, riset , jika tak disandarkan pada Filsafat Ilmu dan Statistika Ilmu Sosial ; ini sebuah koreksi untuk Dunia Pendidikan SUMUT yang sudah sangat usang !!!

BANYAK BERJALAN BANYAK DILIHAT ,BANYAK PENGALAMAN, BANYAK PEMAHAMAN .

IBARAT SEEKOR KATAK DALAM TEMPURUNG !!!

---Sunggal, 19 Pebruari 2015----Sopar M.H --- --


(7)

7

BAB 1

PENDAHULUAN

1.1 Konsep dalam Statistika

Statistika bagian dari metode dan teknik penelitian ilmiah .

Stastika sekarang diterapkan dalam penelitian ilmu sosial untuk pembuat an randangan penelitian (research design ) .

Statistik dibedakan dalam 2 masalah :

(1) Staistika deskriptif yaitu bidang ilmu pengetahuan statistika yang mempelajari tata cara penyusun dan penyajian data yang dikum pulkan dalam sebuah penelitian .

(2) Statistik induktif atau satistik inferensial atau statistika matematis yaitu bidang ilmu pengetahuan statistika yang mempelajari tata cara penarikan kesimpulan mengenai keseluruhan populasi berdasarkan data yang diperoleh dari sebagian populasi tersebut .

Penarikan kesimpulantentang keseluruhan populasi berdasarkan hanya dari pengam.

atan terhadap sebagian populasi disebut induksi atau genera lisasi. Populasi dan Sampel

Pada sensus 1971 ternyata 59.6 % penduduk Indonesia berumur 10 tahun atau lebih mampu membaca dan menulis huruf Latin (BPS) .

Karena sensus membutuhkan uang dan tenaga kerja besar, sensus yang dilakukan hanya sensus sampel bukan pencacahan .

Kelompok yang diamati tadi diasumsikan sebagai wakil( representative) dari keseluruhan penduduk .

Jadi sampel adalah himpunan bagian dari sebuah himpunan populasi. Populasi adalah keseluruhan unsur-unsur yang akan diteliti .

Persentase orang yang mampu membaca dan menulis dalam sampel tadi , merupakan dugaan (taksiran) untuk persentase yang terdapat dalam populasipersentase dalam populasi yang sebenarnya tidak diketahui , melainkan dugaan nilai misalnya 63.2 % .


(8)

8

populasi .

perubahan persentase orang yang mampu membaca dan menulis dalam jangka yang digunakan sebagai dasar menunjukkan apakah program pendidikan yang dijalankan sukses atau tidak .

Contoh ini satu kerja statistika induktif: mendugaciri populasi brdasarkan pengamatan sampel yang diperoleh.

B adalah banyak orang yang mampu baca tulis dan N banyak orang da lam populasi (umur 10 tahun ke atas) , kedua bilangna tersebut tak diketahui .

b dan n bilangan sejenis dalam sampel ( b orang yang mampu calis , sedangkan n jumlah sampel ) , b dan n ditentukan setelah sa mpel ditarik ) . Populasi

Pada contoh di atas Orang Indonesia berumur 10 tahun atau lebih membentuk populasi.

b orang yang mampu baca tulis b orang

yang mampu baca tulis

Sampel ditarik Populasi : N orang

Sampel : n orang

Persentase B/ N .100 Tak diketahui

Persentase b/n .100 Dihitung

INDUKSI

100 b /n penduga Untuk 100 B /N


(9)

9

Sampel

Dalm contoh butahuruf di atas diambil sampel berlainan ( himpunan bagian yang lain dari populasi yang sama ) , kemungkinan besar akan didapatkan nilai persentase yang berlainan .

Misalkan sampel kedua diperoleh 62.9 % . Berdasarkan sampel ini, , persentase populasi akan diduga sebesar 62,9 % . Berbeda dengan sampel pertama .

Apakah pendugaan ini “wajar” atau “dapat dipercaya” , dapat diper tanggungjawabkan ?

Jika sampelnya mahasiswa dan pelajar-pelajar , maka persentase butahuruf nya 0% . Ini takwajar dan tak dapat dipertanggungjawabkan .

Sampel diambil sedemikian rupa sehingga tiap unsurpopulasi mendapat probabilitas (peluang, kesempatan) yang sama terambil dalam sampel . Sampel diambil dengan undian : tiap unsur populasi diberi nomor . Kemudian nomor dikocok, lalu ditarik sebuah unsur , diaduk lagi dan diambil unsur kedua dst.

Sampel demikian disebut sampel acak sederhana (simple random sampling) , di sini unsur yan sudah ditarik dari populasi tidak dikembalikan ke populasi untuk menghindari penarikan unsur sama berulang .

Teori statistik induktif hanya berdasarkan sampel acak sederhana . Statistika Penelitian Ilmu Sosial, Obyektivitas.

Statistika Penelitian ilmu sosial sering memainkan peranan penting penelitian survei (survey) . Penelitian ini mengandung pertanyaan-pertanya an yang diajukan kepada tiap individu yang jawabannya telah diberi kode terlebih dulu .

Penelitian sosial lain, penelitian arsip, case sudy , pengamatan , berparti sipasi dari wawancara tak tersruktur dan pembuatan film .

Penelitian ini sering tak berfaedah karena tak ada penghitungan dan pengukuran .

Kalau statistika dipakai untuk mengananalisis data, maka belum berarti bahwa hasilnya menjadi lebih “baik “ atau lebik “obyektif” .

Obyektif artinya hasil penelitian dan analisis nya dapat diperiksa kembali oleh orang lain, dan setuju .

Yang lebih penting , apa yang harus dihitung ? Apa yang relevan dihitung ? Ekonom Dunia mengukur kemakmuran Indonesia berdasarkan pendapatan per kapita , yaitu rerata pendapatan.


(10)

10

Itu sudah memberi gambaran tentang ekonomi Indonesia dan dibandingkan dengan Negara lain.

Tapi di Indonesia distribusi pendapatan taksimetrik , banyak yang buta huruf dan pengangguran seumur hidup dan hanya beberapa orang berpendidikan Doktor .

Dalam hal demikian, daripada mengambil reratanya , lebih relevan meng hitung median atau modusnya .

Median adalah pendapatan seseorang yang berada “ditengah distribusi” . Modus adalah pendapatan yang paling sering didapat.

Jadi di Indonesia modus nya adalah butahuruf , pengangguran seumur hidup yang tidak penya pendpatan alias nol .

Menurut BIERSTED , bahasa ilmiah, dan konsep-konsep yang digunakan untuk merumuskan , meneliti, dan menganalisis sebuah masalah sebenarnya dipilih sedikit bebas atau lebih baik lagi tidak dipilih terlalu “obyektif” , karena terdapat banyak kemungkinan . Pilihan bahasa ilmiah dipengaruhi oleh kebudayaan, status sosial , umur , agama, dlsb.

Seoran lulusan SMA yang ingin belajar di UNSYIAH Banda Aceh harus menempuh ujian masuk karena tiak terdapat cukup tempat untuk semua orang yang ingin menjadi mahasiswa. Apalagi sekarang Indonesia menjadi tempat Kuliah seluruh penduduk Asia Tenggara, seperti Malasyia, Pilifina, Singapus, Thailand , dan lain-lain. Mereka yang lulus ujian masuk dengan nilai-nilai yang paling tinggi bolehlah diterima di UNSYIAH .

Peneliti A menganalisi soal ini sbb. :

(1)Ujian masuknya terdiri dari soal pilihan ganda, oleh karenanya ujian tersebut dianggap obyektif ;

(2)Kemudian, analisis ujian-ujiannya dilakukan dengan computer dank arena itu analisis tersebut dianggap obyektif ;

(3)Dari (1) dan (2) disimpulkan bahwa setiap lulusan SMA di Indonesia mempunyai kesempatan (probabilitas) yang sama untuk memasuki Universitas Syiah Kuala .

Peneliti B menganalisis soal yang sama sbb. :

(1)Tingkat akademis SMA lebih tinggi di Banda Aceh daripada di luar NAD , karena fasilitas-fasilitas pendidikan yang lebih baik di Ibukota NAD .


(11)

11

(2)Distribusi intelegensi di luar Banda Aceh sama dengan distribusi

intelegensi di Banda Aceh .

(3)Karena orang dari Banda Aceh dan orang dari luar Banda Aceh mengerjakan ujian masuk PTN yang sama, maka lulusan SMA dari luar Banda Aceh mempunyai kesempatan (probabilitas) lebih kecil untuk memesuki UNSYIAH daripada lulusan SMA Banda Aceh . Peneliti A dan B melakukan analisis masalah ini dalam bahasa ilmiah yang berlainan. Kesimpulannya juga berbeda .

1.2 Matriks Data dan Peubah

Dalam ilmu sosial , baris-baris matriks mewakili satuan penelitian (orang, kota, propinsi, keluarga ) dan kolom-kolom matriks mewakili sifat yang diukur pada satuan penelitian .

Orang Peubah

Peubah 1: Umur

Peubah 2 : Pendidikan formal

A 26 3

B 24 2

C 49 3

D 47 1

E 22 2

F 38 3

Keterangan peubah 2 : 1 = tanpa, 2 = SD, 3 = sekolah lanjutan

Bilangan yang digunakan di sini sebagai ukuran sifat atau ciri yang diperoleh di sini nilai yang dimiliki oleh satuan penelitian untuk sebuah konsep atau pengertian tertentu . Pengertian ini disebut peubah .

Di sini 2 peubah , yaitu “umur” dan “pendidikan formal” .

Satuan penelitian yang digunakan adalah orang-orang yang telah ditetapkan menjadi sasaranpenelitian .

Dalam tabel berikut , sasaran penelitian nya “kota” . Peubah –peubah nya :


(12)

12

Peubah (1) : Persentase keluarga yang tidak membagi tempat tinggal

nya dengan keluarga lain .

Peubah (2) : Persentase rumah yang didiami oleh pemiliknya . Peubah (3) : Persentase kelurga yang rumahnya bersaluran listrik .

Kota Peubah

Peubah 1 Peubah 2 Peubah 3

Jakarta 73,9 50.4 20.7

Medan 66.9 56 29

Pontianak 73.2 67.1 28

Manado 65.3 72.1 31.7

Peubah Kontinu dan Peubah Diskrit

Sebuah peubah dinamakan kontinu jika nilai-nilai peubah membentuk sebuah kontinum. Artnya untuk 2 nilai sembarang selalu terdapat nilai ketiga yang berada antara 2 nilai tersebut .

Kalau peubah ini bernilai a dan b ( a< b) , maka juga mengambil nilai =1

2 + , dengan < < .

Biasanya kontinum ini dibentuk oleh himpunan bilangan nyataatau himpun an bagiannya .

Peubah seperti umur, panjang, berat, suhu, tingkat urbanisasi , tingkat kriminalitas, tingkat agresi, tingkat kohesi kelompok (kekokohan kelompok) secara teoritis dapat dianggap sebagai peubah kontinu.

Jika sebuah peubah tidak kontinu , disebut diskrit .

Untuk smbarang dua nilai diskrit , tak selalu dapat ditemukan nilai ketiga di antaranya .

Cpntoh-contoh peubah diskrit adalah : banyak penduduk, anggota kelurga, kelamin, propinsi tempat lahir, pilihan parpol, manyaknya tahpol, banyaknya orang bunuh diri, dan pertunjukan film .


(13)

13

Batas Ketelitian Pengukuran

Nilai sebuah peubah kontinu , seperti tinggi (p) seseorang , tergantung pada ketelitian (accuracy) pengukurannya , dan dinyatakan sebagai 1.65 atau 1.635 m, dst. Pada pengukuran pertama ketelitiannya lebih rendah .

= 1.65 1.645 < 1.655 = 1.653 1.6525 < 1.6535 Ada batas pada tingkat ketelitian dalam proses pengukuran.

Karenanya peubah kontinu ditemukan secara empirik dalam kelas-kelas (interval-interval ) seperti

1.605 < 1.615 , = 1.61 1.615 < 1.625 , = 1.62 1.625 < 1.635

, = 1.63 dst .

Jadi , setiap pengukuran mempunyai batas ketelitian .

Jadi , jika peubah kontinu dioperasionalkan , maka peubah tersebut menjadi diskrit .

Dalam statistika peubah diskrit sering didekati oleh peubah kontinu . Dalam 1.616 dituliskan dalam 4 angka berarti (significant figures ) .

Jumlah penduduk 100 000 orang , tidak jelas berapa angka 0 di antaranya yang berarti .Akan lebih baik dituliskan 1.0 × 105 orang , jika 1 angka 0 yang dianggap berarti .

Sebuah bilangan bisa juga tingkat ketelitiannya ditulisakan sbb.: = 1.62 ± 0.03

Di sini kesalahan pengukuran 0.03 m , buksn 0.05 . Jadi , arti nilai ini 1.59 < 1.65 .


(14)

14

Reduksi Data

Dalam penelitian sosial , satuan analisinya sering berjumlah ratusan , dn jumlah peubah yang diamati bisa sampai 100 peubah .

Data bisa diringkaskan atau direduksikan .

Misalnya menghitung rerata sebuah peubah untuk mewakili nilai-nilai tsb. Data Tabel ditas dapat diurutkan sbb.:

Kota Peubah

Peubah 1 Peubah 3

Jakarta 73,9 20.7

Pontianak 73.2 29

Medan 66.9 28

Manado 65.3 31.7

Hubungan peubah 1 dan peubah 3 , makin besar nilai peubah 1, maka makin kecil nilai peubah 3 .

Ukuran untuk 3 peubah atau lebih dapat diselidiki sekaligus .

Analisis hubungan 2 peubah atau lebih disebutn analisis peubah berganda (multivariate analysis) atau analisis dimensi berganda .

Dua analisis yang dapat dibuat :

(a) Analisis matrik data berdasarkan peubah-peubah (kolom-kolom) ; (b) Analisis matriks data beritik tolak dari satuan-satuan penelitian

(baris-baris) .

Kedua titik –tolak iani akhirnya akan menghasilkan ringkasan matriks data yang kira-kira sama .

1.1 Pengukuran , Jenis Skala

Dari Konsep sampai Pangamatan

Tujuan ilmu empirik adalah melukiskan gejala-gejala dengan deskripsi em pirik dan diusahakan mencapai penyusunan kaidah-kaidah umum.


(15)

15

Atas dasar kaidah-kaidah umum yang dirumuskan dalam teori , selanjutnya dijelaskan lagi gejala-gejala empirik yang ditemui untuk digunakan membuat ramalan-ramalan ilmiah .

Tidak semua pengertian teori (theoretical concept atau theoretical construct ) dapat diukur langsung . Misalnya , bagaimana dapat diukur “intelegensi” ?

Jika pengertian teori diukur , masalah tersebut dilaksanakan dengan ter

lebih dulu “mengoperasionalkan” pengertian tersebut .

Operasionalisasi artinya harus diusahakan memecah atau menguraikanpe ngertian teori ke dalam sejumlah dimensi yang bisa diukur .

Misalnya , operasionalisasi 2 pengertian teori dilaksanakan sbb. :

(a) “status sosial ekonomi” : dimensi pendapatan dan dimensi gengsi

pekerjaan (professional prestige )

(b) “intelegensi” : skor dalam tes intelegensi yang terdiri dari beberapa

soal ; setiap soal merupakan 1 dimensi .

Dalam operasionalisasi , hakikat pengertian tidak berubah .

Apakah hal yang diukur dalam satu tes intelegensi memang kira-kira sesuai

dengan pengertian “intelegensi” seperti yang diartikan teori ?

Pendek kata : apakah validitas pengukuran cukup baik ? TORGERSON melukiskan kerangkanya spb.:

PT5

PT6

PT1

PT2

PT3

PT4

PO1

PO2

PO3

PO4

Pengertian teori

Pengertian yang dioperasionalisasikan

Data yang dapat diamati , alam


(16)

16

Garis-garis menggambarkan :

________ hubungan teoritis antara beberapa pengertian

_ _ _ _ _ _ hubungan antara pengertian teori (PT) dan pengertian yang yang telah dioperasionalkan (PO)

__________

__________ garis kesesuaian atau definisi operasional dari pengerti an yang dioperasionalkan

Di sini , pengertian teori 1, 2, 3, 4 yang dioperasionalkan menjadi berurut-urut 1, 2, 3, 4.

Pengertian 5, 6 merupakan pengertian yang diamati dengan bantuan pengertian lain, melalui hubungan 1, 2, 3, 4 .

Dengan demikian , pengertian 5, 6 merupakan pengertian(peubah) yang tidak langsung diamati (unobservable ) .

Pengertian 1, 2, 3, 4 merupakan pengertian atau peubah yang dapat diamati .

Berbeda pengukuran dsatu ujian alam ilmu alam, dan ilmu sosial. Dalam ilmu sosial hubungan garis putus-putus labih banyak dan data yang dapat diamati kurang jelas dan berbelit-belit .

Garis kesesuaian menyatakan bagaimana pengertian yang dioperasi onalisasikan diukur .

Misalnya , “pengetahuan tntangkurang” , yang menjawab 6 pertanyaan

dengan baik mendapat nilai “sedang” , dan yang menjawab lebih dari 6 pertanyaan dengan baik mendapat nilai “baik”.

Di sini skalanya , himpunan nilai-nilai { kurang sekali, kurang, ,sedang, baik} .

Jenis-jenis Skala

Jawaban terhadap pertanyaaan “ Apakah Anda puas dengan susunan baru

acara radio ? “ dapat diukur sepanjang skala , ,

, .

Untuk mengukur berat sepucuk surat dapat dipakai timbangan dengan skala dalam gram.


(17)

17

Skala Nominal

Misalkan sebuah penelitian dilakukan di daerah pedesaan .

Untuk tiap orang yang termasuk sampel , peubah “jenis pekerjaan “ diukur. Ingin diteliti apakah seorang responden yang terpilih petani atau bukan . Untuk itu digunakan 2 himpunan untuk mengelompokkan para responden

tersebut , yaitu himpunan “petani” dan himpunan “lain-lain” .

Tiap responden akan diamati dan dimasukkan ke dalam salah satu dari 2 him punan tersebutt .

Skala yang dipakai dalam pengamatan ini mempunyai 2 titik skala : “petani”

dan “lain-lain”

Skala semacam itu juga dipakai jika kita menggolongkan seseorang dalam himpunan “orang Islam” , “Orang Kristem”, “orang Hindu”, “dll.”.

Dalam contoh terakhir , skala untuk mengukur peubah “agama” terdiri dari 4 titik .

Titik skala atau nilai skala ini disebut kelas (class) atau kategori (category) . Jenisskala ini, yang objek pengamatannya (observation) dikelompokkan ke dalam himpunan-himpunan, dinamakan nominal .

Pengukuran ke dalam himpunan-himpunan itu sebenarnya sama saja dengan melihat apakah 2 objek yang diamati sama atau tidak .

Proses pengukuran yang menggunakan skala nominal juga disebut klasifikasi (classification) atau penggolongan ke dalam beberapa kelas atau kategori . Skala Ordinal

Kadangkala, di dalam sebuah penelitian orang ingin membedakan 2 buah pengamatan , tidak hanya menurut persamaannya atau perbedaan nya (apakah kedua pengamatann termuat dalam himpunan yang yang sama atau tidak ), tetapi juga menurut urutan atau tingkatannnya .

Seorang anggota ABRI dapat diklasifikasikan menurut pangkatnya : himpun an Kapten, Letnan, dst.

Antara titik sklala Kapten, Letnan,Mayor, prejurit, dll terdapat urutan tertentu : pangkat Kapten lebih tinggi dari Letnan dan lebih rendah dari Mayor . Dengan demikian , diberikan sebuah orde atau urutan tertentu diantara titik skala nya (misalnya lebih tinggi –lebih rendah , lebih tebal-lebih tipis , lebih keras-lebih lunak, lebih besar-lebih kecil ) .

Skala semacam ini disebut skala ordinal .

Pengukurannyan dilakukan pada tingkat ordinal : obyek-obyek dibedakan menurut persamaannya dan menurut urutannya .


(18)

18

Skala Interval

Untuk menentukan apakah perbedaan pangkat , atau kedudukan sosial, antara Kapten dan Letnan sama dengan perbedaan pangkat antara Mayor dan Kapten merupakan hal yang sulit .

Dalam pengukuran pada tingkat ordinal tadi , masalah “perbedaan jarak”

atau “ interval” antara 2 titik skala tidak tidak diperhatikan .

Jika dikatakan bahwa pengukuran dilakukan dengan skala ordinal , maka tidak dinyatakan suatu apapun tentang jarak antara 2 titik skala .

Namun, ada skala-skala yang jarak antara setiap 2 titik skala nya memeng diketahui .

Contohnya , skala dari tahun almanak .

Kejadian-kejadian dalam sejarah bisa ditempatkan menurut waktu terjadinya : akhir PD II terjadi pada tahun 1945 M .

Dengan skala seperti ini, dapat ditentukan apakah kejadian yang satu mendahului yang lain (urutan) , dan juga dapat ditentukan berapa jauhjarak dalam tahun yang memisahkan 2 kejadian tertentu .

“Lima tahun kemudian “ berarti ( tenpatkanlah kejadian pada skala waktu ) 5 satuan skala(satuan skalanya adalah 1 tahun ) lebih jauh .

Jarak antara 2 titik skala di sini diketahui dalam sejumlah tahun .

Satu tahun adalah waktu yang dibutuhkan Bumi mengitari Matahari dalam satu putaran.

Satu tahun merupakan satuan skala tersebut .

Sebuah skala di mana jarak (interval) antara tiap 2 titik skalanya diketahui (di samping pembedaan menurut persamaan dan urutan titik skala nya ), dinamakan skala interval .

Jadi, sebuah skala interval mempunyai semua sifat skala ordinal, ditambah dengan satu sifat khas yaitu sa tuan skala (scale unit) atau satuan pengukuran .

Skala Rasio

Tahun-tahun almanak tersebut diukur dari titik orientasi tertentu , yaitu kelahiran Mesiah yang merupakan permulaan tahun Masehi atau “tahun 0” . Namun, titik orientasi ini dipilih bebas : bagi sementara orang, titik orientasinya adalah tahun ketika Nabi Muhammad hijrah dari Mekah. Dengan skala interval ini tidak dapat dikatakan bahwa tahun 2000 M “ 2 kali


(19)

19

Orang yang menghitung tahun mulai dari tahun 800 M (tahun penobatan Karel Akbar menjadi Kaisar ) akan terpaksa menerjemahkan ini sbb. : tahun 1200 setelah penobatan Karel adalah “2 kali lebih besar” daripada tahun 200 setelah penobatan Karel.

Adanya semacam keganjilan dalam deskripsirasio disebabkan oleh karena titik nol dari perhitungan tahun , dapat dipilih secara sembarang atau sekehendak peneliti .

Namun, ada skala yang titik nolnya tidak dipilih sembarang ; titik nol di sini mengandung arti .

“Tidak berbobot” dipakai unuk menyatakan titik nol pada timbangan.

“Dua kali lebih berat” berarti : bila sekantung gula beratnya 1 kg , maka 2 kantung “ 2 kali lebih berat” .

Skala untuk mengukur banyaknya orang , barang , atau lain-lain : skala bilangan cacah .

Bisa dikatakan “banyaknya mahasiswa yang hadir dalam kuliah kemarin 3 kali lebih besar daripada hari ini “

Titik nol yang dipilih tidak sembarang disebut murni atau sejati .

Jenis skala dengan sejati (natural origin) , sehingga ra sio antara sembarang 2 nilai skala juga dapat ditentukan dengan jelas , dinamai skala rasio .

Skala ra sio berbeda dengan skala interval .

Skala rasio mampu membandingkan dan antara 2 pasang skala

, , sama atu tidak .

skala tahun almanak adalah skala interval . Tapi jangka waktu jarak yang berlalu antara 2 kejadian membentuk sebuah skala rasio .

Misalnya dapat dikatakan, dengan skala rasio , jangka waktu pertama berlangsung 5 kali lebih lama daripada yang kedua .

0

–800

800

0

1000

200

2000

1200 Skala

Masehi Skala Karel


(20)

20

Struktur Tingkatan 4 Macam Skala

Skala dirutkan menurut “daya pembeda” atau kemampuannya :

Skala Yang dapat ditentukan 2 amatan

sembarang

Nominal Persamaan (klasifikasi)

Ordinal Persamaan dan urutan

Interval Persamaan,urutan dan jarak (ada

satuan pengukuran)

Rasio Persamaan,urutan,jarak dan rasio

(ada titik 0 murni )

Perhatikan Strukturnya sbb. :

No Sifat skala Mempunyai sifat (ya) atau tidak mempunyai sifat (tidak)

Nominal Ordinal Interval Rasio 1 Kesamaan antara 2

pengamatan

: =

≠ , kualifikasi penga matan dapat dilaku kan

Ya Ya Ya Ya

2 Urutan tertentu : > < , pengukur an pengamatan dapat dilakukan

Tidak Ya Ya Ya

3 Kesamaan interval :

− = −

− ≠ −

ada satuan peng ukuran

Tidak Tidak Ya Ya

4 Kesamaan rasio :

=

atau ≠ ada titik 0


(21)

21

Dalam matris data di atas , peubah 1 (umur) diukur pada skal rasio , dan peubah 2 (pendidikan formal) diukur pada skalaordinal .

Dalam pembuatanskala menurut metode dengan interval-intervalyang seolah-olah sama (method of equal –appearing intervals) , kepada tiap responden diberikan sejumlah obyek dan kemudian responden itu diminta untuk mengurutkan obyek-obyek tersebut ke dalam beberapa himpunan sedemikian rupa sehingga interval antara himpunan-himpunan ini sama menurut anggapan responden tersebut .

Himpunan objek ini terdiri , misalnya, dari 100 macam pekerjaan , dan responden diminta mengurutkan pekerjaan-pekerjaan menurut statusnya , menurut sifat menarik nya , atau menurut sifat lainnya.

Dalam metode ini dianggap responden itu mampu membuat sebuah skala interval , karena satuan pengukuran inilah yang akan digunakan .

Dalam pembuatan skala perimbangan THURSTONE, responden hanya diminta untuk memilih obyek yang paling tinggi nilainya , (besar, berat, manrik, keras, dsb.) dari satu pasangan obyek .

Jadi responden hanya membandingkan 2 obyek (method of paired comparison) dan untuk pasangan tersebut urutan menurut besarnyaditentukan , atau skala ordinal dibuat untuk 2 obyek tersebut. Responden tak usah membari informasi mengenai interva l antara 2 obyek seperti dalam metode dengan interval-interval seolah-olah sama di atas . (proses ini diulang dengan pasangan obyek lain ; dari pernyataan-pernyataan subyektif beberapa responden tersebut kemudian dibuat satu skala interval untuk kelompok berdasarkan law of comparative judgment .

Oleh sebagian orang, misalnya , penggolongan tidak dianggap sebagai proses pengukuran , karena besarnya satu sifat obyek tidaklah diukur dalam penggolongan .

Menurut STEVENS dan COOMBS , penggolongan atau klasifikasi sebagi sebuah sebuah proses pengukuran , sehingga menjadi lebih umum dan sesuai dengan skal berdimensi berganda (multidimensional scalling) .

Sebuah skla berdimensi berganda bisa dibuat berdasarkan peubah-peubah yang diukur pada skla nominal .

Dalam skala 2, 3 atau lebih dimensi , titik-titik skala tidak bisa diurutkan menurut besarnya .


(22)

22

Transformasi yang Tak Mengubah Skala

Misalnya penelitian agama , agama apa kah yang dianut orang yang sedang menjadi sasaran penelitiannya . Dibuat penggolongan 3 himpunan ( skala nominal) : Islam, Kristen, dll. dibri kode sbb .:

Islam : kode 1 Kristen : kode 2 Dll. : kode 3

Jika si A Kristen, maka pada baris si A dan dibawah peubah agama diisi nilai 2, dst.

Kode dapat juga dibuat berlainan tanpa mengubah skala : Islam : kode 2

Kristen : kode 3 Dll. : kode 1

Yang penting ketiganya dapat dibedakan .

Skala nominal ini tak berubah karena transformasi yang sifatnya permutasi. Permutasi adalah fungsi 1-1 pada himpunan diri sendiri .)

Hal ini berlaku juga untuk ska la lain.

Skala Ordinal si X ekivalen dengan yang dibuat si Y , bila X dan Y membuat penggolongan yang sama dan aturan titik-titik skala Y dan X sama.

Misalkan titik 1 pada skala X berpadanan dengan (menunjukkan himpunan yang sama) titik 1 pada skala Y begitu juga untuk 2 dengan 2 .

Skala ordinal Y ekivalen dengan skala ordinal X jika berlaku hubungan untuk tiap 1, 2 , dan setiap 1, 2

1> 2⟺ 1> 2 1= 2⟺ 1= 2 atau


(23)

23

1= 2⟺ 1= 2

Transformasi ini monoton.

Transformasi liniir berbentuk = + . 1

2

1 2

Y

X

Turun monoton

2 1

1 2

Naik monoton

2 3

Jarak = b


(24)

24

Besar satuan pada skala Y adalah b kali satuan pada skala X .

Jika 21= 32 , 21= 32 .

Jadi , dua skala interval dikatakan ekivalen jika ada sebuah transformasi liniir antara kedua skala tersebut .

Terakhir , transformasi yang tidak mengubah skla rasio adalah transformasi liniir yang memetakan titik 0 pada skala X ke titik 0 pada skala Y .

Bentuk transformasi ini sbb. : =

Rasio-rasio yang berpadanan pada kedua skala tersebut tidak berlainan : 2

1

=

2 1

Jadi,2 skala rasio dikatakan ekivalen jika ada sebuah transformasi liniir dengan titik 0 tetap antara kedua skala tersebut .

Transformasi yang tidak mengubah sebuah skala sebenarnya mencerminkan tata tingkatan skal itu sendiri .


(25)

25

Jika seorang responden diminta untuk membuat sebuah skala interval menurut metode dengan interval-interval yang seolah-olah sama , pilihan titik 0 dan satuan skala masih bisa ditetapkan secara sembaeang .

Misalnya si A, si B, si C , dan si D menilai objek 1, 2, 3, 4 5 sbb. :

s1 s2 s3 s4 s5

Skala A : 1 3 6 8 11

Skala B : 2 6 12 16 22

Skala C : 0 2 5 7 10

Skala D : 0 4 10 14 20

Jika diperoleh hasil pengamatan seperti di atas , objek-objek

1, 2, 3, 4 5 benar-benar diukur pada skala interval , skala A, skala B , skala C , dan skala D ekivalen satu-sama lain , karena keempat skala tersebut hanyalah berbeda menurut sebuah transformasi liniir = + :

Hubungan skala Transformasi

AB : satuan skala B = 2 kali satuan skala A

= 2 AC : Satuan skala C = satuan skala

skala A ;

skala C digeser 1 satuan ke se belah kiri terhadap skala A

= −1

AD : satuan skala D sama dengan 2 kali satuan skala A ;

skala D digeser 1 satuan skala A terhadap skala A

= 2 −1 = 2 −2

Di sini adalah nilai objek s pada skala A , adalah nilai obyek tersebut pada skala B dst .

Jika peneliti ingin agar semua responden meletakkan titik nol pada tempat yang sama dan menggunakan satuan skala yang sama , maka dia mengam bil


(26)

26

2 obyek dan kemudian menentukan sendiri nilai masing-masing obyek tersebut .

Selanjutnya responden diminta untuk menilai obyek yang lain sesuai dengan nilai 2 obyek baku itu .

Transformasi antara 2 skala jarang tepat liniir atau tepat monoton , karena kesalahan acak (random errors ) terjadi dalam proses penentuan nilai obyek.

BAB 2

DASAR STATISTIKA DESKRIPTIF

2.1 Tabel Distribusi Frekuensi

Dalam sebuah penelitian pendapatan tahunan , dalam puluhan ribuan rupiah , terhadap 90 responden diperoleh nilai-nilai sbb.:

34 30 34 25 33 26 28 38 32 33

36 23 33 29 36 49 39 29 41 45

40 27 45 22 39 31 37 32 43 19

15 46 31 33 43 27 26 36 24 16

23 40 33 34 48 35 37 34 28 42

39 51 30 45 31 35 26 33 29 28

24 31 47 27 21 32 25 38 36 18

18 20 37 21 30 35 24 38 22 29

30 41 30 36 32 31 42 34 35 28

Nilai-nilai ini dicatat sembarang.

Penyusunan atau tata aturan pertama yang dilaksanakan ialah membuat tabel yang mengurutkan nilai-nilai pendapatan tahunan ini menurut bessarnya dan mencantumkan frekuensi nilai itu di belakang tiap nilai tersebut .

Frekuensi sebuah nilai adalah jumlah berapa kali nilai tersebut diukur, pendek kata berapa banyak responden mempunyai pendapatan sebesar nilai itu .


(27)

27

15 / 23 // 31 ---- 39 /// 47 /

16 / 24 /// 32 //// 40 // 48 /

17 25 // 33 --////-

/

41 // 49 /

18 // 26 /// 34 --////- 42 // 50

19 / 27 /// 35 //// 43 // 51 /

20 / 28 //// 36 --////- 44 21 // 29 --////- 37 /// 45 /// 22 // 30 --////- 38 /// 46 /

Langkah berikutnya mengolongkan nilai-nilai ke dalam kela s-kelas . Setiap kelas berisi sejumlah nilai berurutan , tabel ini disebut distribusi fre kuensi yang telah dikelompokkan.

Kelas, Batas Kelas, dan Titik-Tengah Kelas

Saat Anda menggolongkan nilai-nilai ke dalam kelas-kelas haruslah selalu dipikirkan berapa banyak kelas yang akan diambil, berapa lebar tiap kelas, dan manakah batas-batas kelas tersebut .

Demi kesederhanaan penelaahan , umumnya : (a)Lebar setiap kelas dipilih sama besarnya

(b)Banyaknya kelas diambil antara 8 s/d 20 sedemikian rupoa sehingga untuk lebar kelas diperoleh interval yang “sederhana” dalam perhitungannya .

Terlihat dari tabel di atas bahwa nilai yang paling besar adalah “ 51” dan yang paling kecil “15” .

Nilai “51” mewakili sebuah pengukuran antara 50.5 dan 51.5 dan nilai “15” mewakili pengukuran antara 14.5 dan 15.5 .

Jadi, leber interval yang akan tercakup oleh himpunan kelas setidaknya adalah 51.5−14.5 = 37 .


(28)

28

13 kelas dengan lebarkelas 3, yang memberikan panjang interval 13 x 3 = 39 atau

8 kelas dengan lebarkelas 5, yang memberikan panjang interval 8 x 5 = 40 atau

19 kelas dengan lebarkelas 2, yang memberikan panjang interval 19 x 2 = 38 Misalnya, banyaknya kelas ditentukan 13 , dengan lebar kelas 3.

Maka kelas kelas yang berurutan dimulai dari bawah adalah sbb. :

14.5 < 17.5 17.5 < 20.5 20.5 < 23.5

47.5 < 50.5 50.5 < 53.5

Di dalam kelas14.5 < 17.5 terdapat nilai = 15, = 16 = 17. Di dalam kelas17.5 < 20.5 terdapat nilai = 18, = 19 , = 20.

Dengan bantuan Tabel di atas bahwa frekuensi kelas17.5 < 20.5 adalah 4 , yaitu 18 muncul 2 kali, 19 satu kali, dan 20 satu kali .

Namun di sini ada pula informasi yang terlewat atau hilang : kelas 17.5 < 20.5 diwakili oleh titik tengah kelas nya = 19.

Tabel Distribusi Frekuensi bagi Pengamatan-pengamatan yang Dikelom pokkan


(29)

29

Dengan bantuan Tabel di atas dapat dibuat Tabel berikutnya .

Jika ditetapkan mengambil 8 kelas dengan masing-masing lebar kela s sebesar 5 , maka kelas-kelas berurutan, misalnya, sbb :

14.5 < 17.5; …; 47.5 < 50.5; 50.5 < 53.5

Nilai-nilai Pengamatan

Batas kelas Titik tengah kelas

Frekuensi

15,16,17 14.5 < 17.5 16 2

18,19,20 17.5 < 20.5 19 4

21,22,23 20.5 < 23.5 22 6

24,25,26 23.5 < 26.5 25 8

27,28,29 26.5 < 29.5 28 11

30,31,32 29.5 < 32.5 31 14

33,34,35 32.5 < 35.5 34 15

36,37,38 35.5 < 38.5 37 11

39,40,41 38.5 < 41.5 40 7

42,43,44 41.5 < 44.5 43 4

45,46,47 44.5 < 47.5 46 5

48,49,50 47.5 < 50.5 49 2

51,52,53 50.5 < 53.5 52 1

n=90

Fungsi Frekuensi Kumulatif

Fungsi frekuensi kumulatif dinotasikan dengan F dan frekuensi dengan f . Fungsi frekuensi f pada titik = , dituliskan , ialah jumlah berapa kali = muncul .

Dari Tabel di atas 22 = 6 dan 31 = 14 ( kedua nilai x, yaitu 22 dan 31 adalah titik tengah kelas ) .

Nilai fungsi frekuensi kumulatif pada titik a , dituliskan , didefinisikan sebagai jumlah pengamatan yang lebih kecil atau sama dengan a .


(30)

30

22 = 16 + 19 + 22 = 2 + 4 + 6 = 12 dan

31 = 22 + 25 + 28 + 31 = 12 + 8 + 11 + 14 = 45 Jadi , 52 = 90 .

Kadangkala digunakan fungsi frekuensi relatifdan fungsi frekuensi kumulatif relatif.

Keduanya diperoleh Dri frekuensi kumulatif mutlak : Titk tengah

x

Frekuensi f Frekuensi Relatif

f

rel

Frekuensi Kumulatif F

Frekuensi kumulatif

F

rel

16 2 0.02 2 0.02

19 4 0.04 6 0.07

22 6 0.07 12 0.13

25 8 0.09 20 0.22

28 11 0.12 31 0.34

31 14 0.16 45 0.50

34 15 0.17 60 0.67

37 11 0.12 71 0.79

40 7 0.08 78 0.87

43 4 0.04 82 0.91

46 5 0.06 87 0.97

49 2 0.02 89 0.99

52 1 0.01 90 1

n = 90 1

Jika n jumlah seluruh pengamatan, maka

=1 =1 .

Jadi mempunyai kisaran nilai dari 0 s/d 1. 2.2 Grafik

Grafik memberikan bahan-bahan angka lebih baik dan cepat . Grafik yang sering histogram, polygon frekuensi .


(31)

31

Histogram

.Histogram digambar di atas setiap kelas dengan luas sebanding frekuensi kelas tersebut

Polygon Frekuensi

Cara menggambarnya : G Ambil lebar kelas sama

G Di atas tiap titik tengah kelas dicantumkan satu titik dengan tinggi yang sesuai dengan frekuensi kelasnya .

G Titik-titik tersebut dihubungkan oleh garis lurus yang membentuk polygon;

G Sebelum kelas pertama dan setelah kela s terakhir dibubuhkan kelas dengan frekuensi 0, sehingga polygon dimulai dan diakhiri pada sumbu horizontal (sumbu X) .

10

20 30 40 50 60

0.05 0.1 0.15

0.2

x pendapatan tahunan dalam Rp 10.000


(32)

32

Polygon Frekuensi Kumulatif

Nilai-nilai pada fungsi frekuensi kumulatif tidak diletakkan pada titik- tengah kelas , melainkan pada batas kelas , sbb.:

t Pada batas bawah kelas pertama , frekuensi kumulatifnya bernilai 0 ; di bawah batas ini tak ada pengamatan ;

t Pada batas atas kelas pertama ( batas bawah kelas kedua ), frekuensi kumulatifnya sama dengan banyaknya pengamatan dalam kelas pertama ( untuk frekuensi kumulatif relatif, nilai frekuensi kumulatif ini adalah banyaknya pengamatan dibagi dibagi dengan n )

t ……….

t Pada batas atas kelas terakhir , frekuensi kumulatifnya sama dengan n (atau 1 untuk frekuensi kumulatif relatif ), karena di bawah batas ini terdapat semua pengamatan .

5 10 15

10 20 30 40

50

60

x pendapatan tahunan dalam Rp 10.000

0.5 1

F


(33)

33

Fraktil ( Fractile atau Quartile )

Arti dari frekuensi kumulatif relatif adalah :

=

a

Untuk 0 < < 1 , maka fraktilq , dilambangkan dengan , bagi fungsi frekuensi kumulatif F didefinisikan sebagai = .

Jadi , fraktilq , atau , ialah titik pada sumbupengamatan sedemikian sehingga

xq

=

0.5 0.75 1


(34)

34

0.5 = 32.5 ; 0.67= 35.5 ; 0.99= 50.5

Konsep “ fraktil” sering digunakan di dalam fungsi probabilitas .

Perbandingan Dua Distribusi Frekuensi

Seringkali 2 distribusi frekuensi (atau 2 distribusi frekuensi kumulatif ) di bandingkan .

20 40 60

0.1 0.2

Luas dataran = q

X

q

f

rel


(35)

35

Contoh , distribusi umur akseptor KB di Kab.Tangerang .

Dalam penelitian ini diperoleh data mengenai distribusi umur para akseptor KB di 12 klinik. Klinik tersebut dibagi secara geografik dalam 4 kelompok . Di sini ingin dibandingkan 2 kelompok, kelompok 1, klinik-klinik sepanjang pantai (Teluk Naga, Mauk, dan Kronjo) , dan kelompok 2 , klinik-klinik di kota Tangerang (Tangerang I, Tangerang II, RSU Tangerang, ABRI ) .

Kelas Umur

Frekuensi mutlak Frekuensi relatif Frekuensi kumulatif relatif Pantai Kota T Pantai Kota T Pantai Kota T

14,15,16 6 0 0

17,18,19 22 37 0.01 0 0.01 0.05

20,21,22 55 101 0.05 0.05 0.06 0.05

23,24,25 73 125 0.12 0.14 0.19 0.18

26,27,28 56 123 0.16 0.17 0.35 0.35

29,30,31 85 130 0.13 0.16 0.48 0.51

32,33,34 17 77 0.19 0.17 0.67 0.69

35,36,37 93 88 0.04 0.1 0.71 0.79

38,39,40 34 45 0.21 0.12 0.92 0.91

41,42,43 1 16 0.08 0.06 0.99 0.97

44,45,46 2 9 0 0.02 1 0.99

0.01 0.01 1

444 751 1 1

0.25

f

Distribusi frekuensi

relatif umur akseptor

- - - pantai _____ Tangerang


(36)

36

Ingin diteliti seberapa jauh distribusi umur di daerah pantai berbeda dari distribusi umur di kota Tangerang .

Di sini perbandingan distribusi frekuensi mutlak gak berfaedah secara lang sung ; harus dilihat dari frekuensi relatif .

Dari gambar , nyatalah bahwa di aerah pantai secara relatif lebih banyak akseptor berumur 35 tahun atau lebih daripada di kota Tangerang .

Nyata di kota Tangerang secara relatif lebih banyak akseptor berumur antara 20-28 daripada di pantai .

Tapi jika dilihat dari Tabel , ini sangat sukar , jadi rafik sebagai sarana penya jian data .

Perbedaan apakah yang nampak dari 2 kesimpulan ?

Secara sosiologis menarik, relevan ( dan secara statistika nyata atau tidak ) ti dak didalami di sini .


(37)

37

Dari kutipan Indikator Sosial 1974 (BPS : 1975,62) , terdapat pola pengeluaran keluarga -keluarga di Jakarta (belanja pendapatan) tahun 1968 /1969 .

Persentase dibulatkan :

1. Makanan : 54 %

2. Perumahan : 15 %

3. Pakaian : 9 %

4. Aneka barng dan jasa : 22 % Dalam bagan nampak bagian relatif dari pendapatan .

Piktogram

Jenis diagram ini, tiap simbol (lambing) mewakili sejumlah orang, binatang, uang, rumah, dan sebagainya.

Pertumbuhan penduduk Indonesia , yang dihitung ( 1961, 1971) dan yang ke mudian diramalkan pada tahun 1978 untuk tahun 1981, 1991, dan 2001 (BPS) , dilukis sbb.:

1961

makanan pakaian

Aneka barang dan jasa


(38)

38

1971

1981

1991

2001

Grafik Deret Waktu (Time Series )

Deretwaktu ialah sajian deretan nilai sebuah peubah tertentu yang disusun menurut waktu dengan interva l waktu tertentu .

Angka –angka penduduk Indonesia di atas merupakan deret waktu .

Grafik deret waktu dibentuk dengan menampilkan peubah pada jangka wakttu tertentu .

Berikut ramalan pertumbuhan penduduk Indonesia tahun 1961 sampai dengan 1991 ( Nitisastro : 1970, 249) .

Tahun 196 1

196 6

197 1

197 6

198 1

198 6

199 1

Jumlah pendud uk

97 108 119 132 149 171 198


(39)

39

dalam

jutaan Partum buhan antar waktu dalam jutaan

1 1

1 1

1 3

1 7

2 2

2 7

Dari Tabel baris 3 , dan grafik , tampak nyata sifat tak linierdari gejala per tumbuhan : potomgan garis-garis tersebut tidaklah lurus menyambung, tetapi merupakan tanjakan yang semakin tajam .

Grafik Distribusi Frekuensi pada Tingkat Pengukuran Nominaldan Ordinal

Jika peuah yang diukur Nominal dan Ordinal , maka histogram atau polygonfrekuensi bukan penggambaran yang baik .

200

150

100

50

1961 1971 1981 1991

Tahun

Jumlah penduduk dalam jutaan


(40)

40

Dalam histogram ada assumsi bahwa frekuensi kelas terbagi secara seragam atau terbagi rata pada keseluruhan interval .

Dalam kasus di mana sebuah peubah diukur pada skala nominal , tidak aka nada sebuah interval , misalnya peubah “agama” dapat mempunyai nilai – nilai “Islam”, “Hindu”, dan “ dll.”

Dalam kasus demikian , lebih baiklah nilai diletakkan pada sumbu horizontal dan mendirikan garis-garis vertikal di atas tiap nilai tersebut. Demikianlah terbentuk bagan garis (line chart) .

Untuk alasan didaktik , di sini dipakai histogram sebagai penggambaran grafik untuk semua peubah yang diukur pada tingkat interval dan rasio , termasuk peubah-peubah diskrit .

Untuk peubah-peubah nominal dan ordinal sejauh mungkin akan dipakai bagan garis ; di buku lain digunakan histogram .

3.2 Ukuran Pemusatan dan Ukuran Penyebaran

Sebuah ukuran merupakan besaran atau fungsi yang nilainya dihitung atas dasar nilai unsur-unsur di dalam populasi atau sampel .

Ada 2 jenis ukuran yang penting : 50

100

I

H

K

L

150


(41)

41

(a)Ukuran yang menunjukkan tempat atau letakdistribusifrekuensi :

Apakah distribusi yang satu berada di sebelah kiri atau di sebelah kanan distribusi yang lain .

Ukuran ini disebut pemusatan (central tendency) .

(b)Ukuran yang menunjukkan penyebaran atau disperse distribusi frekuensi :

distribusi yang satu lebih lebar daripada distribusi yang lain , disebut penyebaran (disperse).

Ukuran pemusatan dan penyebaran terutama penting dalam pembandingan 2 distribusi atau lebih .

Dalam contoh di atas , ukuran pemusatan dinyatakan sbb. :

Letak distribusi frekuensi untuk daerah pantai berada agak di sebelah kanan distribusi frekuensi kota Tangerang .

penyebaran


(42)

42

Ukuran pemusatan di antaranya : rerata hitung , modus , dan median . Ukuran penyebaran paling sering adalah simpangan baku dan simpangan kuartil .

Ukuran Pemusatan

(a)Rerata Hitung ( arithmetic mean )

Rerata hitung n bilangan adalah jumlah semua bilangan tersebut dibagi n .

Rerata hitung n bilangan 1, 2,… , dinyatakan dengan lambing . Menurut definisi

=

1+ 2+ 3+ +

=

1

=1

Jika banyaknya anak dalam 9 keluarga berurut-urut adalah 2,2,5,5,7,7,7,8, 11, maka rerata hitung banyaknya anak per keluarga adalah :

=1

9 2 + 2 + 5 + 5 + 7 + 7 + 7 + 8 + 11 = 6

Jika pengamatan-pengamatan nya telah diringkaskan dalam bentuk sebuah tabel frekuensi yang telah dikelompokkan , dengan kelas ke-i mempunyai titik-tengah kelas ( atau nilai kelas) dan frekuensi sebesar , maka rerata hitung dituliskan sbb. :

=

1 =1

,

=

=1

Di sini , h adalah banyaknya kelas dalam sebuah tabel frekuensidata yang dikelompokkan .

Dalam contoh di atas , tabel distribusi frekuensi yang dikelompokkan nya sbb . :

Banyak


(43)

43

per

keluar ga (xi) :

Freku ensi (fi) :

2 0 0 2 0 3 1 0 0 1

Dengan demikian rerata hitung nya :

=1

9 2 2 + 2 5 + 3 7 + 1 8 + 1 11 = 6

Rerata hitung mempunyai arti yang sejajar dengan pengertian pusat gaya berat dalam ilmu alam .

Ketelitian biasanya dinyatakan dalam satu angka lebih banyak daripada jumlah semua data asalnya .

(b)Median

Median n pengamatan adalah pengamatan yang paling tengah setelah semua pengamatan itu diurutkan menurut besarnya.

Dalam kasus banyaknya pengamatan genap , tak ada pengamatan paling tengah , maka diambil median rerata dari pengamatan ke- ½ n dan pengamatan yang ke –( ½ n + 1) .

Dalam contoh di atas dengan 9 keluarga dan masing-masing anaknya : 2,2,5,5,7,7,7,8, 11 , median nya ditulis Me , yaitu pengamatan ke-5 ,

yaitu = 7 ( ) .

Jika dalam 10 keluarga banyak anak masing-masing adalah 2,13,12,2,7,11,3,8,5, 8 maka median nya adalah :

=

1

2

7 + 8

= 7

1 2

.

Untuk data yang telah disajikan dalam bentuk daftar frekuensi yang dikelompokkan , median didefinisikan sebagai titik pada sumbu pengamatan yang di bawahnya terletak separuh dari keseluruhan pengamatan .


(44)

44

Jadi , median adalah fraktil 0.5 dari fungsi frekuensi kumulatif : 0.5 . Pada contoh di atas = 0.5 = 32.5 .

Untuk menghitung fungsi frekuensi kumukatif , kadangkala harus diadakan interpolasi .

Untuk perhitungan fraktil 0.75 dalam distribusi yang disajikan di atas , interpolasi nya demikian :

Karena∆ dan ∆ ′ ′ sebangun, maka : ′ = : ′ ′ , sehinga ∆ =0.08

0.12. 3 = 2 . Dengan demikian 0.75=35.5+ = 37.5 .

(c)Modus atau Kelas Modal

Modus sejumlah pengamatan adalah pengamatan berfrekuensi terbesar. Pada distribusi frekuensi pengamatan-pengamatan yang dikelompok kan ( dengan lebar kelas konstan) , kelas yang mempunyai frekuensi terbesar dinamakan kelas modul .

A

B

C

B’

C’

38.5

0.75

35.5

0.79 0.67

0.67 0.75 0.79

F


(45)

45

Seringkali kelas modal ini disingkat : modus .

Jadi , untuk kurva sebuah distribusi frekuensi yang berpuncak satu dan tidak terlalu taksimetrik , berlaku kurang labih hubungan antara ketiga ukuran pemusatan sbb. :

− = 3 − Pemakaian Ukuran Pemusatan

Pilihan jenis ukuran yang dipakai untuk mengukur pemusatan mencari sifat sebuah distribusi frekuensi tergantung beberapa faktor.

Jika pengamatan tidak banyak, modus sangat tergantung pada fluktuasi acak. Modus jarang digunakan.

Jika distribusi frekuensi berpuncak satu dan bersifat kira-kira simetrik , rerata hitung ukuran terbaik . di sini peubah diukur pada tingkat interval ataurasio .

Jika distribusi frekuensi berbentuk sangat miring , mengandung pengamat an sangat besar atau sangat kecil disbanding pengamatan lainnya , median lebih baik dari rerata hitung .

Berpuncak dua Berpuncak satu

= =

Simetrik

Pengamatan sangat besar


(46)

46

Contoh

Di pedesaan, agar keluarga tani dapat mencukupi kebutuhan minimal mereka , produksi beras setiap petani harus berjumlah paling sedikit kira-kira 1000 kg . Misalkan pada tahun tertentu , 11 petani di desa masing-masing menghasilkan panen padi dalkam kg sbb. :

800,2800,600,5000,700,1200,600,500,900,500,700 .

Reratahitung panen padi pada tahun tersebut adalah 1300 kg dan median panen padi 700 kg .

Dalam kasus sederhana ini , sangat tidak tepat jika hanya dikatakan bah wa rerata panen padi adalah 1300 kg , dan karenanya berada di atas minimum kebutuhan hidup . Ini disebabkan hanya 3 di antara 11 petani itu berada pada tingkat bilangan yang sangat mencolok , yaitu 2800 dan 5000 , yang jauh melebihi bilangan lain, ukuran pemusatan dapat dinyatakan lebih baik oleh median . Informasi lain mengenai bentuk distribusi ditambahkan.

Ukuran Pemusatan Daerah pantai Kota Tangerang

Rerata 29.4 tahun 29.2 tahun

Median 29.4 tahun 28.9 tahun

Modus 36.5 tahun 30.5 tahun

Berdasarkan Tabel, , distribusi ðaerah pantai sedikit sebelah kanan distribusi “kota Tangerang .


(47)

47

Dua distribusi bisa mempunyai ukuran disperse atau penyebaran berbeda, sekalipun reratanya sama .

Misalnya 2 distribusi frekuensi berpuncak satu dan simetrik mempunyai rerata sama, tetapi penyebaran berbeda .

Pengamatan-pengamatan kelompok I bersifat lebih homogen , lebih dekat satu sama lain daripada kelompok II .

Berikut ukuran penyebaran untuk membandingkan 2 atau lebih distribusi frekuensi .

(a)Jangkauan

Ukuran penyebaran sangat sederhana dan kasar .

Jangkauan ialah selisih antara pengamatan terbesar dann terkecil . Jarang digunakan.

(b)Rerata Penyebaran

Makin banyak pengamatan menyimpang dari pusat distribusi , makin besar nilai ukura penyebaran .

Bagi tiap pengamatan ditentukan jarak antara pengamatan dari rerata . Rerata jarak-jarak tersebut disebut rerata penyebaran .

Jarak sama atau lebih besar dari 0 :

H

I

Perbandingan lebar 2 distribusi

4= 7 2= 9 = 12


(48)

48

Rerata distribusi = 12.

Diperoleh :

1− = 17−12 = 5 ; 1 1− = 5

dan

4− = 7−12 =−5 ; 4 4− = 5

di mana = 0 − < 0

Jika 4 1terletak sama jauhnya dari ; 2 5sama jauhnya dari . Jika ada n pengamatan 1, 2,… , , dengan rerata :

=1 =1 − Tanda harga mutlak jarang digunakan.

Untuk pengamatan 2,2,5,5,7,7,7,8,11 , reratanya = 6 , sehingga rerata penyebaran nya :

=1

9 4 + 4 + 1 + 1 + 1 + 1 + 1 + 2 + 5 = 20

9

(c)Simpangan Baku

Nilai − , negatif jika < . − 2 selalu positif .

Ukuran penyebaran yang menyebar sekitar rerataberbentuk : 1

− 2 =1

Untuk ini, semakin jauh letak sebuah pengamatan dari , makin besar nilai fungsi tersebut .


(49)

49

Jika bentuk di atas diakarkan diperoleh :

1

− 2 =1

Bentuk ini disebut simpangan baku .

Simpangan baku di atas ditulis sedikit berbeda :

= 1

−1 − 2 =1

Bentuk kedua simpangan baku tersebut berbeda pada n dan −1 . Jika n besar, maka perbedaan itu hilang .

Nilai −1 disebut banyaknya derajat bebas (degrees of freedom ) untuk simpangan baku .

Dalam menghitung s , ukuran digunakan .

Jika dan s dihitung dari pe ngamatan 1, 2,… , .

Jika sudah tetap , tak berubah-ubah , maka −1 pengamatan “dapat dipilih secara bebas”.

Sebuah ilustrasi , diketahui rerata 3 bilangan sama dengan 15.; bilangan per tama 11 dan yang lain 16 . Maka bilangan ketiga harus 18 .

Kalok bilangan pertama 7 , yang lain 25 , tentu yang ketiga 13.

Di sini hanya 2 bilangan dipilih bebas , ini berarti banyaknya derajat bebas untuk s sama dengan v = 2 .

Simpangan baku di atas , pembaginya −1 .

Jika s dihitung dari sampel acak sederhana , maka kuadrat simpangan bakumerupakan penduga tak bias (unbiased estimator ) untuk simpangan baku populasi.

Jika pengamatan makin jauh satu sama lain, atau makin menyebar, maka nilai s makin besar .

Kuadrat dari simpangan baku disebut variansi .

2= 1

−1 − 2 =1

Untuk pengamatan-pengamatan dikelompokkan dalam tabel frekuensi , dengan titik tengah berfrekuensi , maka smpangan baku didefinisikan sbb. :


(50)

50

= 1

−1 − 2 =1

h adalah banyak kelas .

Misalkan 9 pengamatan , 2,2,5,5,7,7,7,8,11 , di mana reratanya 6 .

= 1

8 −4

2+4 2+1 2+1 2+ 12+ 12+ 22+ 52

= 66

8 = 2.9 .

Misalkan sebuah tabel frekuensi untuk pengamatan yang dikelompokkan sbb. :

. − −

3 1 3 -12 144 144

6 3 18 -9 81 243

9 2 18 -6 36 72

12 9 108 -3 9 81

15 8 120 0 0 0

18 5 90 3 9 45

21 6 126 6 36 216

24 3 72 9 81 243

n=37 555 1044

Jadi , = =

Dengan demikian = 1

36× 1044 = 5.4

. Jika distribusi frekuensi nya kurang lebih simetrik dan berpuncak satu , maka hamper semua pengamatannya terletak dalam interval

−3 , + 3 .


(51)

51

Ini khususnya berlaku untuk distribusi empirik yang mirip dengan distribusi probabilitasnormal .

Untuk distribusi normal , hanya ¼ % dari seluruh pengamatan terletak di luar interval ±3 sekitar rerata hitung .

Sifat tersebut dapat digunakan untuk menduga besarnya simpangan baku . Untuk setiap distribusi, setidaknya 89% dari seluruh pengamatan nya terletak dalam −3 , + 3 .

(d)Simpangan Kuartil (semi –inter kuartile range)

Simpangankuartil menggunakan fraktil 0.75 dan fraktil 0.25 dari fungsi frekuensi kumulatif :

=1

2 0.75− 0.25 Simpangan kuartil juga ditulis :

=1

2 0.75− 0.5 + 0.5− 0.25 di sini 0.5= .

~6

0.5 1

F


(52)

52

Jadi, simpangan kuartil mengukur penyebaran pengamatan di sekitar median.

Simpangan baku , sebaliknya ,mengukur penyebaran di sekitar rerata . Untuk distribusi frekuensi pendapatan di depan diperoleh 0.75= 37.5

0.25= 27.3 sehingga

=1

2 37.5−27.3 = 5.1 .

Simpanganbaku dihitung :

= 7.9 .

Simpangan baku dapat diduga secara kasar menggunakan

6 ≈ = 39 , ≈6.5 .

Nilai sebenarnya ≈7.9 > 6.5 .

Penggunaan Ukuran Penyebaran

Dalam tiap definisi ukuran penyebaran digunakan jarak antara 2 pengamat an.

Jadi, tiap ukuran penyebaran hanya dapat diterapkan jika peubahnya diukur pad skala interval dan rasio .

Untuk peubah nominal digunakan “tingkat keseragaman” (uniformity) atau “tingkat ketidakkonsentrasian” .

Jika peubah diukur pada skala interval, koeifisien tersebut dapat dianggap sebagai ukuran penyebaran .


(53)

53

Kehilangan Informasi Akibat Pengelompokkan Pengamatan

Pengelompokan pengamatan dapat menghilangkan informasi , tapi penga ruh tidak begitu besar terhadap perhitungan ukuran pemusatan atau penyebaran . Perhatikan perbandingan berikut :

Data yang

tak dikelompok kan

Data

yang dikelompokkan

∶ 32.4 32.6

∶ 7.84 7.91

Ukuran Lain untuk Distribusi Frekuensi

Distribusi frekuensi dapt juga ditandai dari ukuran ketaksimetrisan (asymmetry ) dan ukuran derajat keruncingan kurva frekuensi (kurtosis) . Juga dapat diukur sejumllah momen (moment) bagi distribusi .

Tapi dalam ilmu sosial , ukuran ini tak perlu ! !!

2.1 Distribusi Frekuensi berdimensi Berganda ; Tabel Silang

Tabel berikut data untuk 30 responden dicantumkan nilai-nilai untuk peubah kelamin ( 1 = lelaki , 2 = wanita ) , umur ( dalam tahun) dan pendi dikan sekolah ( 1 = gak pernah sekolah ; 2 = pernah waktu SD tapi sebentar ; 3 = tamat SD ) .

Nomor responden ditulis pada kolom 1 dan 2 , peubah kela min pada kolom 3 , peubah umur pada kolom 4,5 dan peubah pendidikan sekolah pada kolom 6 .

Kolom Kolom


(54)

54

0 1 1 2 4 2 1 6 1 2 7 3

0 2 2 3 6 1 1 7 2 3 7 1

0 3 1 2 6 2 1 8 1 4 9 1

0 4 1 4 5 2 1 9 1 3 3 2

0 5 1 2 2 2 2 0 1 3 0 2

0 6 2 6 3 1 2 1 2 6 2 1

0 7 2 4 1 2 2 2 2 2 4 3

0 8 1 2 5 3 2 3 1 4 3 1

0 9 2 2 9 1 2 4 1 2 6 2

1 0 2 3 7 1 2 5 2 4 6 2

1 1 2 3 5 3 2 6 2 5 1 2

1 2 2 4 3 1 2 7 1 3 1 2

1 3 1 5 1 2 2 8 2 3 9 1

1 4 2 4 6 2 2 9 2 3 2 3

1 5 1 2 4 3 3 0 2 4 5 1

Misalkan ingin diketahui bagaiman hubungan antara peubah “umur” dan peubah “pendidikan sekolah” .

Datanya diatur demikian :

Dalam tiap kotak dimasukkan frekuensi mengenai gabungan umur/ pen didikan sekolah .

Dalam kotak di ujung kiri bawah , misalnya, akan didapatkan sejumlah responden yang berumur 31 tahun atau lebih dan yang tak berpendidikan . Hasilnya , untuk data di atas , berupa sebuah tabel distribusi frekuensi ber

dimensi 2 atau tabel silang (cross tabel ) berikut .

Jumlah semua frekuensi pada baris 1 menunjukkan banyaknya orang dalam sampel yang berumur 30 tahun atau lebih muda . : yaitu 10 , sedangkan jumlah semua frekuensi pada baris 2 menunjukkan banyaknya orang dalam sampelyang lebih tua dari 30 tahun, yaitu : 20 .

Kolom akhir menunjukkan distribusi frekuensi peubah umur .

Umur Pendidikan Sekolah Distribusi

Umur

1 2 3

30 tahun atau lebih muda


(55)

55

Lebih tua

dari 30 tahun 1 8 2 11

Distribusi pendidikan sekolah

2 13 6 n = 21

Baris akhir menunjukkan distribusi frekuensi untuk peubah pendidikan sekolah .

Distribusi ini disebut distribusi samping (marginal ).

Dari Tabel yang berumur 30 tahun atau lebih muda (relatif) berpendidikan lebih tinggi dari yang lebih 30 tahun.

Peubah kelamin dapat disertakan untuk membuat distribusi frekuensi berdimensi 3 .

Tabelnya sbb. :

Lelaki (1) Wanita (2)

Umur Pendidikan Pendidikan

1 2 3 1 2 3

30 0 5 3 8 1 0 1 2

> 30 2 4 0 6 8 4 2 14

2 9 3 14 9 4 3 16

Banyaknya responden terlampau kecil untuk dapat menarik kesimpulan. Namun dapat dilihat :

S

Semua lelaki yang berumur 30 tahun atau lebih muda pernah mendapat pendidikan sekolah;

S

Di antara lelaki yang berumur labih dari 30 tahun, sepertiganya tidak pernah sekolah karena miskin.

S

Di antara perempuan yang berumur lebih 30 tahun, kira-kira 60%

nya tidak pernah sekolah karena anak yatim .

Diagram Balok untuk Untuk Distribusi Frekuensi berdimensi 2

Di atas kotak pada distribusi berdimensi 2 ini ditempatkan sebuah balok yang volume nya sesuai dengan frekuensinya.


(56)

56

Dari sebuah distribusi frekuensi berdimensi , frekuensi dalam kotak pada baris ke-i dan kolom ke- j dilambangkan .

Bentuk umum sebuah Tabel silang seperti di bawah .

Jika semua kolom j dijumlahkan untuk i tertentu yang tetap , maka diperoleh :

.= =1 = 1+ 2+ + + +

Di sini k banyak kelas untuk peubah 2 .

. adalah banyak responden pada kelas i dari peubah 1 .

. = =1 = 1 + 2 + + ( b = banyak kelas peubah 1 ). . merupakan banyaknya responden yang terdapat pada kelas j untuk peubah 2 .

Peubah x

Peubah y Distri

busi pinggir x

1 2 … …

1 11 11 … 1 … 1 1.

frekuensi

peubah 2


(57)

57

2 21 22 … 2 … 2 2.

3 31 32 … 3 … 3 3.

. … … … .

. … … … .

1 2 … … .

. … … … .

. … … … .

1 2 … … .

Distri busi pinggir y

.1 .2 … . … .

Distribusi frekuensi berdimensi 1 untuk peubah 1 ( distribusi frekuensi pinggir dalam tabel silang : kolom akhir ) adalah :

Kelas peubah 1 :

1 2 3 … b

Frekuensi :

1. 2. 3. … .

Untuk peubah 2 : baris akhir : Kelas

peubah 2 :

1 2 3 … k

Frekuensi :

.1 .2 .3 … .

Sebuah ukuran yang didasarkan pada nilai 2 peubah bersamaan adalah kovariansi, untuk mengukur kuatnya hubungan antara 2 peubah .

2.5 Penggunaan dan Penyalahgunaan Statistika

DISRAELI , There are three kinds of lies : lies, damned lies, and Statistics .


(58)

58

sengaja dibuat tidak begitu obyektif atau netral seperti yang sering dibayangkan orang.

BAB 3

PENARIKAN SAMPEL

3.1 Pengertian

Dalam sebuah sampel acak sederhana , setiap unsur populasi mempunyai probabilitas yang sama untuk ditarik ke dalam sampel .

Sampel tak acak , sepertipurposive sample atau quota sample , tidak bisa digunakan untuk menarik kesimpulan atas dasar teori statistika tentang populasi .

Sampel acak dibagi dalam 2 macam : (1)Sampel acak sederhana

(2)Sampel terlapis (stratified sample) , sampel berkelompok (cluster sample), sampel sistematik (systematic sample) ,sampel bertahap (multi-stage sample) .

Jika tak ada keterangan relevan yang lain mengenai unsur populasi , maka penarikan sampel acak sederhana paling baik .

Jika keterangan tentang beberapa peubah yang relevan bagi penelitian. Keterangan tentang undur populasi ini bisa digunakan sebagai dasar untuk memilih teknik yang lebih tepat (efisien) untuk penarikan sa mpel.

Sikap seorang pedagang dan yang bukan pedagang harus dibedakan. Selanjutnya dari tiap kelompok diambil sampel .

Kedua sampel kemudian digabung membentuk sampel terla pis bagi populasi .

Sampel terlapis lebih efisien dari sampel acak sederhana .

Kalau di dalam rancangan penelitian nya peubah umur dianggap besaran yang paling penting untuk membedakan sikap orang , maka pelapisannya dibuat menurut kelas umur .


(59)

59

Kalau diasumsikan orang dari kampung berbeda dengan orang kota , maka pelapisan dilakukan menurut tempat tinggal di kampung atau di kota .

Daftar administratif yang mencakup semua unsur populasi disebut kerangka (frame) untuk penarikan sampel .

Selalu ada kekurangannya :

(1)Daftar tidak lengkap, ada unsur tak terdaftar (2)Ada unsur terdaftar berulang-ulang

(3)Mengandung unsur yang seharusnya tidak termasuk ke dalam populasi . Jika pada kerangka sampel terlalu besar , sampel acak tak bisa ditarik . Maka yang dlakukan penarikan sampel berkelompok (cluster) atau sampel bertahap .

Berapa besar sampel harus diambil ? Tergantung banyak faktor !

Berapa anggaran penelitian, fasilitas anlisis seperti software , rancangan penelitiannya , variansi populasinya , dlsb.

Sensus dan Sensus Sampel , Survei dan Survei Sampel

Sensus ialah penelitian dengan mendaftarkan seluruh populasi atau kelompok pada waktu tertentu ,dengan titik berat pencatatan atau pencacahan ciri tertentu dari populasi , misalnya sensus produksi, sensus lalin , susduk. Secara konvensional, dalam sensus setiap unsur dalam populasi diteliti. Sensus sampel adalah penelitian sebagian populasi menggunakan metode sensus .

Sensus berkaitan dengan peubah “dasar” (nama,umur, kelamin, status kawin, pekerjaan dsb.)

Sensus sampel meneliti peubah lebih dalam (tenaga kerja, migrasi, kesuburan /impotensi , mutu dan luas fasilitas rumah/ kumpul kerbo , dlsb.)

Peubah “dasar” diukur pada setiap unsur populasi , peubah lain dari sampel ,

5% atau !0% populasi .

Sensus tek lengkap hanya meneliti sebagian peubah . Survei penelitian lebih dalam dari sensus . Survei sampel penelitian terhadap sebagian populasi .


(60)

60

Ialah daftar semua kemungkinan sampel yang bisa diterik dari populasi . Contoh : 2 unsur diambil tanpa pemulihan dari populasi , , , , , , tanpa mengembalikan lagi ke populasi semula.

Maka ruang sampel nya :

, , , , , , , , , , , , , , , , , Jadi ada 10sampel.

Kalok 4 unsur ditarik dari , , , , tanpa pemulihan , bisa aja kayak gini , , , , , , , , , , , , , , , , , , ,

Ada 5 sampel .

Sering dibedakan antara , , .

Jadi sampel ditentukan dengan memperhatikan urutan penarikannya , maka sampelnya jadi 2 kali lipat atau 20 sampel.

Dalam penelitian hanya 1 sampel saja yang diteliti .

3.2 Sampel Acak Sederhana Tabel Angka Acak

Prusedur undian dalam sampel acak sederhana , paling baik menggunakan angka acak , yang berisi angka 0 s/d 9 .

Daftarnya berisi angka –angka diambil acak sederhana dengan pemulihan . Misalnya ingi ditarik sampel acak dengan 8 unsur dari 8134 unsur , yang dinomori 1 s/d 8134. Disediakan 10 tabel angka acak 50 baris x 50 kolom se perti Lampiran 3 .

Missal pada Tabel 3 “ditusuk” sebuah angka sembarangan dan kemudian , dari kiri ke kanan ( bisa loncat ke baris berikutnya) , dapat dibaca sebuah bilangan 5 angka. Misalnya 70205 . Berarti penarikan unsur sampel dimulai pada Tabel 7 , dengan baris 02 dan kolom 05 : 7 – 02 – 05 .

Pada titi ini , dari kiri ke kanan angka-angkanya dibagi dalam kelompok 4 angka .


(61)

61

Bilangan 4 angka yang diperoleh dengan cara , yang mengandung salah satu dari 0001, 0002,… , 8134, menunjukkan nomor unsur yang terambil di dalam sampel .

Dengan contoh ini diperoleh 9506,7544,8196,7818,… Bilangan 1 dan 3 diabaikan : no ini gak ada di populasi . Unsur 7544 termasuk sampel , dst.

Assumsi tanpa pemulihan, bilangan yang 2 kali nongol diabaikan.

Pembagian bilangan 4 angka ini bisa dari kanan ke kiri atau dari atas ke bawah , atau pakelah prosedur lain .

Ini bisa jugak pakek computer !

3.3 Sampel Acak lain (a)Sampel Terlapis

Populasi dibagi beberapa lapisan , subpopulasiatau stratum . Dari tiap lapisan selanjutnya ditarik sebuah sampel acak .

Populasi = 1+ 2+ + unsur dan sampel terlapisnya = 1+ 2+ + unsur .

Di sini , dari lapisan ke-j ditarik sampel acak berisi unsur = 1,2,… , . Lapisan dibuat berdasarkankriterium pokok yang relevan untuk tujuan analisis atau untuk meningkatkan keefisienan pendugaan, misalnya (1) jenis

Lapisan 1 Lapisan 2 … Lapisan L Besar N1 besar N2 … besar NL

Sampel Sampel Sampel

bagian 1 bagian 2 …bagian L

(acak) (acak) (acak)

Besar n1 besar n2 besar nL


(62)

62

kelamin, (2) kelompok umur, (3) propinsi , (4)kelas pendapatan, (5) jenis pekerjaan, (6) perusahaan , menurut besar usaha, (7) suku bangsa .

Ini digunakan untuk membedakan beberapa kelompok yang dianggap relevan , sesuai rancangannya .

Contoh fasilitas transport , misalnya dibandingkan sikap pedagang dan yang bukan .

Biasanya sampel terlapis lebih efisien dari sampel acak sederhana . Kelompok harus homogen relatif terhadap peubah yang diteliti .

Alasan lain, kerangka sampel sudah dibagi ke dalam subkerangka terlapis . Mobil sekabupaten , merupakan sebuah stratum .

Metode memilih distribusi besar sampel dari tiap lapisan , yaitu pilihan 1, 2,… , dengan syarat 1+ 2+ + = .

Alokasi optimum dari 1 / tegantung simpangan baku dalam lapisan , besarnya lapisan j , , dan cost penarikan satu unsur dalam lapisan tersebut .

Besarnya sampel dari lapisan j , , akan naik jika naik , jika naik, dan turun .

Untuk alokasi sebanding (proporsional) berlaku : 1

1

=

2

2

=

=

Jadi , dari tiap lapisan ditarik persentase unsur yang sama .

Dalam penelitian sosial , sangat rumit, peubahnya sangat banyak dan tidak diukur pada skala interval atau skala rasio.

Jika beberapa peubah diteliti sekaligus , umumnya alokasi optimumyang didasarkan pada peubah 1 bukan alokasi optimum untukmpeubah 1.

Metode untuk itu hanya untuk peubah yang diukur pada skala interval atau skala rasio .

Akibatnya , sosiolog terpaksa memilih 1, 2,… , agak intuitif . Dengan mengambil cukup banyak unsur dari tiap lapisan yang hendak dibandingkan .

Jika populasi nya dibagi 2 lapisan , alokasi 1= 5 dan 2= 195 kurang jika dibandingkan dengan alokasi 1= 75 dan 2= 125, berapun 1 2 dalam populasinya .


(63)

63

Untuk sampel terlapis , penghitungan pendugaan rerata populasi tidak mudah .

Misalkan sebuah sampel acak terlapis ditarik dari populasi dengan 2 lapisan . Misalkan lapisan pertama terdiri dari 1 unsur dan lapisan kedua terdiri dari

2 unsur.

Misalnya rerata lapisannya 1 2 .

Dengan demikian , pendugaan rerata populasi dihitung :

=

1 1+ 2 2

1+ 2

Umumnya penduga ini gak sma dengan rerata sampel , ∶

=

1 1+ 2 2

1+ 2

Tetapi, jika sampel acaka nya sebandingartinya: 1

1

=

2 2

Dan

=

.

(b)Sampel Berkelompok

Misalkan populasi yang diteliti dibagi dalam K kelompok yang saling lepas ( mutually exclusive) .

Dari K kelompok ditarik sampel acak berisi k kelompok . Unsur-unsur k kelompok membentuk sampel acak berkelompok .

Jadi, unsur-unsur tidak ditarik satu-persatu , melainkan kelompok per kelompok .

Penarikan bisa secara acak sederhana , atau dengan probabilitas yang sebanding dengan besar kelompok masing-masing .

Pembagian dalam kelompok-kelompok : (a)Populasi : anak-anak kelas III SD di Indonesia


(64)

64

Kelompok : kelas-kelas III SD di Indonesia

(b)Populasi : penduduk Indonesia tahun 1978

Kelompok : keluarga-keluarga di Indonesia tahun 1978 . (c)Populasi : petani-petani disebuah daerah .

Kelompok : peta daerah dibagi dalam petak-petak persegi panjang (grid) ; pada tiap petak terletak sejumlah daerah pertania , petani pemiliknya membentuk sebuah kelompok .

Banyak unsur sebuah kelompok tidak diketahui sebelum penarikan dan tidak sama untuk tiap kelompok.

Dalam contoh pertama, banyak anak tidak sama di tiap kelas III SD dan daftar nama anak sebuah kelas umumnya diperoleh di sekolah bersangkutan .

sebuah sampel acak sederhana terdiri 600 rumah yang mewakili populasi rumah di sebuah kota lebih baik daripada sampel acak berkelompok 20 blok yang masing-masing terdiri 30 rumah .

Tapi gak mungkin menarik sampel rumah di sebuah kota , karena biaya dan waktu .

Dalam sampel berkelompok, hubungan antara unsur-unsur dalam satu kelompok harus diperhatikan .

Biasanya rumah di satu jalan bersifat sejenis : semua rumah besar , atau semua kerdil , atau semua sedang.

Sikap terhadap sesuatu homogen, usahakan tidak homogen dengan membagi dalam kelompok-kelompok .

Sampel berkelompokmyang berisi kelompok lebih kecil lebih baik .

Kelompok buta huruf, pengangguran di sebuah lingkungan akan mempunyai sikap sama dan status sama yaitu pemalas , dan kumpul kerbo.

Hubungan antara unsur-unsur di dalam kelompok yang sama diukur dengan koeifisien korelasi dalam kelompok , asal peubah diukur pada skala interval atau rasiom.

Jika koeifisien korelasi dalam kelompok positif , artinya kelompok lebih homogen dari populasi nya , sebaliknya jika negatif.

(c)Sampel Sistematik


(65)

65

Adalah sebuah bentuk khusus di mana satu kelompok dipilih secara acak sederhana dari sejumlah K kelompok yang menyusun populasi .

Misalkan orang ingin menarik sebuah sampelsistematik berisi 10 unsur dari dari populasi 1000 unsur .

Nomor urut masing-masing dikumpulkan ke dalam 100 kelompok yang berisi 10 unsur .

Kel.1 Kel.2 Kel.3 … Kel.100

1 2 3 100

101 102 103 200

201 202 203 300

901 902 903 1000

Dari 100 kelompok ditarik 1 kelompok acak sederhana .

Jika sampel sistematik ditarik dari seperangkat kartu , berarti kartu 1 ditarik acak sederhana dari 100 kartu pertama .

Jika kartu 1 adalak kartu ke- n , maka nomor-nomor unsur yang ada dalam sampel adalah :

+ 100, + 200, + 300,… , + 900

Biasanya sampel sistematik merupakan pendekatan yang cukup baik, pendugaan dan keefisienan nya sama cermat dengan sampel acak sederhana . Khususnya jika kartu disusun dengan urutan acak (randomization of order ) sebelum penarikan sampel sistematik .

(d)Sampel Bertahap

Sampel ini ditarik bertahap .

Pertama populasi dibagi menjadi berapa lapisan. Selanjutnya sejumlah lapisan dipilih ( tahap I ) .

Tiap lapisan terpilih dibagi lagi dalam berapa kelompok.

Dari tiap lapisan pada tahap I , dipilih lagi sejumlah kelompok (tahap II ). Dst.

Angka yang dilingkarimenunjukkan yang terpilih sebagai sa mpel .

Lapisan I II III IV V (tahap 1)


(66)

66

Kelompok :

(tahap 2) 1 2 3 4 5 6 1 2 3 4

Unsur : a b c d a b c a b a b c a b c d (tahap 3)

Jadi , sampel yang terpilih 9 unsur :

−1−,2,1−,4−4,4, ,6−4,−2− , Berikut adalah contoh penarikan sampel 2 tahap .

Tahap pertama : pilih 20 kelas dari kelas-kelas III SD di Indonesia. Tahap Kedua : pilih 5 murid dari tiap kelas (berjumlah 20 ) yang telah

terpilih dalam tahap pertama.

Di sini sampel nya mencakup 20 × 5 = 100 murid kelas III SD di Indonesia. Sampel ini dipakek kalok gak ada daftar kerangka penarikan sampel yang mencakup semua unsur populasi ( misalnya populasinya semua murid SD di Aceh ) .

Untuk sampel bertahap , kerangka penarikan sampel nya disusun bertingkat. Pada tingkat I hanya diperlukan daftar lapisan .

Pada tingkat II hanya diperlukan daftar kelompok dalam tiap lapisan terpilih. Di sini gak perlu lagi daftar kelompok lapisan gak terpilih pada Tingkat I. Dst.

Jika tiap penarikan dilakukan acak, sampel bertahap kadangkala pende katan yang baik bagi sampel acak sederhana .


(67)

67

Hasil pengamatan dari pengukuran sampel a cak digunakan menarikkesimpulan mengenai populasi .

Misalnya reratasampel digunakan untuk menduga rerata populasi . Dalam proses pendugaan berapa kesalahan bisa terjadi .

Ada 2 kesalahan :

(a)Kesalahan disebabkan penarikan sampel(sampling error) ;

(b)Kesalahan bukan disebabkan penarikan sampel ( nonsampling error) Kesalahan disebabkan penarikan sampel terjadi kerena sebuah sampel acak adalah bagian dari populasi: hanya n dari N unsur populasi yang diteliti. Banyak kemungknan menarik n unsur dari N .

Tiap sampel acakbisa ditarik , nilai persentase butahuruf , tergantung pada komposisi sampel .

Jadi pendugaan (estimasi) sebuah ciri (parameter) populasi , seperti rerata , sudah lumrah gak bisa sama betul dengan nilai populasi .

Kesalahan bukan kerena penarikan sampel :

(1) Kegagalan untuk mengukur berapa unsur yang telah ditarik dalam sampelkarena responden tidak ada di tempat pada waktu wawan cara atu karena menolak diikutkan penelitian.

Ini disebut takberjawab (nonresponse) dalam sampel .

(2) Proses pengukuran kurang baik kerena, operasionalisasi konsep kurang baik , pertanyaan gak jelas, responden gak menjawab dengan benar, wawancara kurang persiapan .

(3) Dalam penyusunan data terjadi kesalahan, misalnya pengkodean tiap jawaban (coding) , dalam perhitungan , dll.

Ketiga kesalahan dapat menyebabkan bias (biased) dalam hasil penelitian , yaitu, tentang populasi tidak tepat kerena data pengukuran berdasarkan sampel tidak tepat .


(68)

68

Kesalahan jenis (2) dan (3) bisa dihindari jika rancangan penelitian baik, daftar pertanyaan dicobakan dulu dalam survei pendahuluan (pilot survei) dengan teliti ..

Mengurangi takberjawab dalam sampel, kembali ke tempat responden . Jika gak bisa, terpaksa harus diduga berapa besar pengaruh orang yang tak bisa diwawancarai . Jangan mengganti responden takberjawab, tag ada gunanya .

Jika besar sampel ditambah , , kesalahan penarikan sampel berkurang., tapi kesalahan yang lain bertambah, kerena penelitian makin rumit .

Contoh

Siapa saja dan kenapa mereka menonton acara-acara di TIM ? Metode penelitian wawancara dengan daftar pertanyaan yang dibakukan. Responden 200 orang , diwawancarai 10 menit sebelum acara dimulai. Daftar penonton pada satu malam gak tahu, jadi gak ada kerangka penarikan sampel .

Sebenarnya definisi populasi nya sudah kurang tepat : semua orang yang akan menonton sebuah acara selama penelitian berlangsung .

Populasi dibagi dalam berapa lapisan menurut jenis acara, yaitu music pop, teater tradisional, moder,film , dll.

Pada satu malam, penonton diwawancarai.

Ada yang tak sempat diwawancarai , tapi itu kecil , gak berarti. Pemilihan sampelsistematik .

Yang dipilih orang yang ketiga masuk, untuk menghindari subyektivitas. Dilakukan acak sederhana .

Ternyata sulit, pewawancara semua wanita, hanya 1 lelaki. Malam I , lebih 35% responden wanita.

Malam II , 30% lebih wanita . Malam III, 25% wanita. Malam IV, wanita 20% .

Penarkan sampel acak sederhana makin kurang baik.

Gak sengaja, pewawancara wanita menyukai responden lelaki , terjadi subyektivitas !

Besar lapisan tak diketahui. Rerata umur 200 reponden tak bisa digunakan langsung untuk menduga rerata umur dalam populasi .


(69)

69

Jika besar lapisan tahun 1975 diketahui, pada tahun 1976 distribusinya diassumsikan kurang lebih sama.

BAB 4

TEORI PROBABILITAS

4.1 Penerapan Probabilitas Intuitif

Menarik kesimpulan tentang populasi dengan pasti gak mungkin , kecuali : sampelsama dengan populasi dan dugaan intervalnya mencakup segala kemungkinan yang ada .

Dalam contoh persentase bebas buta huruf di atas , interval mencakup segala kemungkinan 0% -100% .

Secara intuitif , semakin teliti (makin kecil) dugaan interval , makin kecil ke pastiannya .

Berikut contoh persentase orang yang bebas buta huruf .

Penggunaan pengertian probabilitas sehari-hari .

Misalkan Poltak tiap Senin pukul 10 pagi pergi kuliah.Poltak berangkat dari kosan pukul 9.30 dan ternyatatepat waktu kuliah , jadi probabilitas nya besar.

Begini Poltak menghitungnya :

9.30

63.2 100%

0%

63.2 100%

0%

63.2 100%

0% Pendugaan interval T in g k a t n a ik k e te li ti a n T in g k a t tu ru n k e p a st ia

n Probabilitas pendugaan mencakup persentase populasi Kepastian mutlak, Pasti betul Probabilitas besar Probabilitas lebih kecil


(1)

(2)

(3)

(4)

(5)

346

CURICULUMVITAE

Identitas :

Nama : Sopar M.H.

Lahir : 19 Pebruari 1967 di Balik Papan , Kalimantan Timur. Pendidikan :

1. SD NEGERI 060922 TANJUNG REJO

2. SMP BUDI BERSUBSIDI SUNGGAL , MEDAN 3. SMPP NEGERI 24 , MEDAN SUNGGAL /IPA

/TAMAT 1986

4. IKIP NEGERI MEDAN /SARJANA PENDIDIKAN MATEMATIKA/ TAMAT 1991

5. UNSYIAH BANDA ACEH /MAGISTER SAINS EKONOMI / TAMAT 2005

6. UNPAD BANDUNG / PROGRAM DOKTOR SAINS EKONOMI / MASUK 2005

Pekerjaan :

Dosen PNS KOOPERTIS WIL. I SUMUT Pengalaman yang Pernah Diemban :

1. Dosen MATEMATIKA ASTRONOMI , MATEMATIKA TEHNIK , MATEMATIKA EKONOMI Akademi Maritim Belawan (AMB) ,Medan , Tahun 2001 – 20 05.

2. Dosen MATEMATIKA EKONOMI , EKONOMIMIKRO , EKONOMI MAKRO di Universitas HKBP NOMMENSEN , UHN Medan , 2012 – sekarang .

Jabatan :

Sekretaris PPL (Program Pengalaman Lapangan ) FKIP HKBP NOMMENSEN MEDAN .

Riset :

Simulasi Gauss Seidel- Reformasi Pajak Indonesia .2003. Computable General Equilibrium.Pemanasan Global Indonesia.2005.

Crowding OutMakroekonometrik Karo .2014.


(6)