GROUP ASSIGNMENT IMPORTANT DATES
PROBABILISTIC & STATISTICS TIM DOSEN UMN Last updated 26 August 2014 COURSE MATERIALS
Week#1: Introduction to Statistics Week#2: Descriptive Statistics Week#3: Probabilistic 1 Week#4: Probabilistic 2 Week#5: Data Distribution 1 Week#6: Data Distribution 2 Week#7: Guess Lecturer/Quiz/Review
- UTS-------------------------------- Week#8: Estimation for single populations Week#9: Hypothesis Testing for single populations Week#10: Hypothesis Testing for two populations Week#11: Data Analysis 1 Week#12: Data Analysis 2
Week#13: Data Analysis 3 Week#14: Student Presentation & SAS Lab Test
- UAS--------------------------------
COURSE MARKING
UAS: 30%
- – Group Project Report: 10%
- – Group Project Presentation : 10%
- – Group Project Poster: UTS: 20%
- – Cognitive Test (Week 1 s/d 6): ASSIGNMENT: 15%
- – SAS Lab Test: 10%
- – Home Work: 5%
- – Class Participation: 3 GROUP ASSIGNMENT IMPORTANT DATES
- Make a group of max 10 students
- Perform a descriptive research about customer behavior • Making a questionnaire.
- Collecting Data • Data Analysis using SAS or other tools
- Making a report
- Making a poster # latest week
- Making a presentation of your poster #latest week
- Submitting report #UAS (take home) 5 OTHERS>UTS: Theory from week #1 to week #6
- Homework: Given by the Lecturer at some weeks
- SAS Lab Test: At latest week about 2x50”
- Class Participation: Get points by Answering review questions in the class.
- STATISTIK (statistic) dalam pengertian bersifat umum berarti informasi yang bersifat numerik. Contoh: gaji rata-rata seorang lulusan perguruan tinggi. Rata-rata mobil di Amerika menempuh jarak 11.099 mil per tahun.
- Dalam arti yang lebuh luas, STATISTIKA (Statistics) adalah ilmu yang mempelajari tentang (1) pengumpulan, (2) pengaturan, (3) analisis, dan (4) penafsiran data untuk membantu proses pengambilan keputusan secara lebih efisien.
- STATISTIKA DESKRIPTIF adalah jenis statistika yang mempelajari tentang metode-metode untuk (1) mengatur, (2) merangkum, dan (3) mempresentasikan data dengan cara yang informatif.
- – Contoh: Sekurang-kurangnya 15 % dari kebakaran yang terjadi di kota Palembang, yang dilaporkan tahun lalu diakibatkan oleh tindakan-tindakan sengaja yang tidak bertanggung jawab.
- STATISTIKA INFERENSIAL adalah jenis statistika yang mempelajari tentang metode-metode untuk mengestimasi sifat populasi berdasarkan sampel.
- – Contoh: Akibat penurunan produksi minyak oleh negara-negara penghasil minyak dunia, diramalkan harga minyak akan menjadi dua kali lipat pada tahun-tahun mendatang.
- STATISTIKA PARAMETRIK
- – digunakan bila karakter populasi memenuhi seluruh asumsi statistika:
- Homogeny • Sampel harus random
- Tingkat pengukuran data = r
- STATISTIKA NON PARAMETRIK
- – Digunakan bila ada salah satu asumsi statistika yang bukan merupakan karakter populasi 9 POPULASI
- Populasi atau universe adalah jumlah keseluruhan dari satuan-satuan atau individu-individu yang karakteristiknya hendak diteliti. Dan satuan-satuan tersebut dinamakan unit analisis, dan dapat berupa orang-orang, institusi-institusi, benda-benda, dst.
- Sampel adalah sebagian dari populasi yang karakteristiknya hendak diteliti. Sampel yang baik, yang kesimpulannya dapat dikenakan pada populasi, adalah sampel yang bersifat representatif atau yang dapat menggambarkan karakteristik populasi.
- – Contoh: Mahasiswa ICT terdiri dari 300 wanita dan 350 pria. Sampel yang diambil adalah 30 wanita dan 35 pria.
- Mempelajari seluruh anggota populasi akan memakan waktu.
- Biaya yang diperlukan untuk meneliti seluruh anggota populasi sangat besar.
- Mempelajari seluruh anggota populasi tidak mungkin dilakukan. Contoh menghitung jumlah anggota populasi ikan di seluruh Indonesia.
- Mengurangi kerugian karena bersifat destruktif. Misalkan pengujian kekuatan tabrakan mobil.
- Hasil-hasil yang diperoleh dari mempelajari sampel sudah memadai. 13 METODE PENGAMBILAN SAMPEL
- SAMPEL ACAK (RANDOM SAMPLING)
- – Anggota sampel dipilih tidak berdasarkan subjetifitas Peneliti.
- SAMPEL TIDAK ACAK (NON RANDOM SAMPLING).
- – Anggota sampel dipilih atas keinginan Peneliti dengan alas an tertentu untuk memudahkan penelitian.
- SAMPEL ACAK SEDERHANA/ SIMPEL RANDOM
- Sampel acak sistematis/ SYSTEMATIC RANDOM
- STRATIFIED RANDOM SAMPLING
- – PROPORTIONAL
- – DISPROPORTIONAL
- CLUSTER RANDOM SAMPLING 15 SAMPEL ACAK SEDERHANA>Kondisi: Jumlah populasi kecil
- Metode: Setiap anggota populasi diberikan nomor, kemudian dipilih secara acak sebanyak yang diinginkan.
- Keuntungan: Setiap anggota sampel dipilih dengan peluang yang sama.
- Kelemahan: Sangat sulit dilakukan untuk populasi berukuran besar. Setiap anggota populasi harus diberikan penomoran dimana proses penomoran ini akan memakan waktu.
- Metode: k=N/n menggunakan pembulatan ke bilangan bulat terdekat. Salah satu anggota dipilih sebagai titik awal, kemudian dipilih setiap anggota ke
- Keuntungan: Tidah karus melakukan penomoran.
- Kelemahan: Harus dilakukan pemeriksaan urutan anggota dan tidak benar-benar acak
- Kondisi: Jumlah populasi besar
- Metode: Populasi yang heterogen dibagi-bagi menjadi beberapa sub kelompok (strata) yang lebih homogen. Kemudian dipilih wakil-wakil dari masing- masing strata secara acak.
- Keuntungan: Lebih unggul dibandingkan sampel acak sederhana dan sampel acak sistematis.
- Sampel yang diinginkan adalah 95. Maka jumlah sample yang diambil berdasarkan masing-masinng bagian tersebut ditentukan kembali dengan rumus n = (populasi kelas / jml populasi keseluruhan) x jumlah sampel yang ditentukan.
- Marketing : 15 / 125 x 95 = 11,4 ≈11 Produksi : 75 / 125 x 95 = 57 Penjualan : 35 / 125 x 95 = 26.6 ≈ 27 19 DISPROPORTIONAL STRATIFIED RANDOM SAMPLING
- Misalnya, populasi karyawan PT. XYZ berjumlah 1000 orang yang berstrata berdasarkan tingkat pendidikan SMP, SMA, DIII, S1 dan S2. Namun jumlahnya sangat tidak seimbang yaitu : SMP : 100 orang SMA : 700 orang DIII : 180 orang S1 : 10 orang
- Jumlah karyawan yang berpendidikan S1 dan S2 ini sangat tidak seimbang (terlalu kecil dibandingkan dengan strata yang lain) sehingga dua kelompok ini seluruhnya ditetapkan sebagai sampel
- Andi ingin melakukan penelitian untuk mencari jawaban berapa gaji lulusan UMN pada bulan pertama mereka bekerja.
- Setiap tahun, UMN menghasilkan 2000 sarjana dan Andi merasa jumlah ini terlalu besar sehingga ia ingin meneliti menggunakan sampel sebanyak 200 orang.
- Dari 200 orang yang didapatkan, terdapat 115 dari DKV, 50 Ilkom, 25 Ekonomi, dan 10 ICT.
- Kemudian ia mendapatkan informasi dari panitia kelulusan bahwa demografi lulusan umn wisuda terakhir kurang lebih DKV 40%, Ilkom 30%, Ekonomi 20%, dan ICT 10%.
- Apa yang harus dilakukan oleh Andi? 21 CLUSTER RANDOM SAMPLING>Metode: Populasi dibagi-bagi menjadi beberapa kelompok (cluster) biasanya berdasarkan letak geografis. Kemudian beberapa cluster dipilih secara acak. Dari setiap cluster yang terpilih, dipilih wakil- wakilnya secara acak.
- Keuntungan: Lebih unggul dibandingkan sampel acak sederhana dan sampel acak sistematis.
- Ekonomis • Sampling frame sudah tersedia
- Dengan biaya sama, bisa mendapatkan jumlah sampel yang lebih besar
- Menghemat waktu
- Keragaman Populasi mungkin tidak terwakilkan
- Elemen pada cluster yang sama memiliki sifat yang sama
- Informasi lebih sedikit karena banyak terjadi pengulangan informasi
- Dengan ukuran sampel yang sama, standard error tinggi bisa saja terjadi dibandingkan teknik sampling lain.
- Kondisi: untuk studi awal
- Anggota Sampel dipilih oleh sesuka Peneliti karena
- Anggota sampel dipilih oleh Peneliti berdasarkan pertimbangan bahwa anggota sampel MAMPU berkontribusi • Keuntungan: save money and time.
- Kekurangan: – Kesalahan keputusan berakibat bias.
- – Kualitas keputusan bisa berbeda-beda.
- – Tidak objektif, karena anggota ekstrim dikeluarkan
- Kuota sampling mirip dengan stratified random sample bedanya:
- – Kuota sampling tidak random – Setiap strata mendapatakan jatah tertentu.
- Penarikan sample pola ini dilakukan dengan menentukan sample pertama. Sampel berikutnya ditentukan berdasarkan informasi dari sample pertama, sample ketiga ditentukan berdasarkan informasi dari sample kedua, dan seterusnya sehingga jumlah sample semakin besar, seolah-olah terjadi efek bola salju.
- Memiliki akurasi yang baik yaitu jumlah error yang kecil.
- Sampel harus memiliki selengkap mungkin karakter populasi
- Memiliki simpang baku (S) yang kecil
- Derajat keseragaman (homogenitas) dari populasi. Makin homogen populasinya, makin sedikit sampel yang perlu diambil.
- Presisi yang dikehendaki peneliti. Makin tinggi tingkat ketelitian yang diinginkan, makin besar sampel yang harus diambil.
- Rencana analisis. Dari sisi presisi, jumlah sampel yang diambil mungkin sudah cukup tapi jika dikaitkan dengan kebutuhan analisis, jumlah tersebut mungkin belum cukup.
- Tenaga, biaya, dan waktu.
- Kemampuan peneliti
- Keadaan (intelektul) responden
- Lokasi penelitian • Informasi yang dapat diperoleh penelitii.
- Adanya penggolongan responden • Populasi.
- GAY DAN DIEHL (1992):
- – Untuk penelitian deskriptif dibutuhkan 10% dari anggota populasi – Untuk penelitian korelasional paling sedikit 30 elemen.
- – Untuk penelitian perbadingan kausal dibutuhkan minimal 30 elemen dari tiap kelompok.
- – Untuk penelitian eksperimen dibutuhkan minimal 15 elemen.
- UMA SEKARAN (1992): – 30 sampai dengan 500 elemen.
- – Bila dipecah menjadi beberapa sub kelompok, masing-masing sub kelompok minimal 30 elemen
- – Untuk penelitian multivariate ukuran sampel 10 kali lebih besar dari jumlah VARIABEL yang akan dianalisis.
- – Untuk penelitian sampel dengan pengendalian yang ketat dibutuhkan 10 sampai dengan 20 elemen. 33 REVIEW schools. Which sampling procedure should be used by Ms. Washington to ensure her sample particularly interested in describing the attitudes of teachers from small, medium, and large Ms. Washington is investigating teachers' attitudes toward year-round schooling. She is is representative of these types of schools?
- likely using which type of sampling technique? When a principal selects a sample of 30 subjects from each of the grades in her school, she is
- from within those schools. His sampling technique is best described schools from within those selected districts, and randomly selected U.S. History classes Suppose Mr. North randomly selected school districts from the state, randomly selected >as …. he using? sample of 42 students by choosing every 14 student on this list. Which type of sampling is Mr. Marino has compiled a list of 1,348 students in his high school. He has selected a th
- TEMUKAN BERBAGAI METODE MENGHITUNG
- Data merupakan kumpulan fakta atau angka atau segala sesuatu yang dapat dipercaya kebenarannya sehingga dapat digunakan sebagai dasar menarik suatu kesimpulan.
- – Contoh: dari surat kabar yang terbit setiap hari, akan dijumpai berbagai informasi mengenai harga sekuritas, komoditas dagangan, kurs mata uang asing, tingkat inflasi yang melanda suatu negara
- Data Primer:
- – Data yang diperoleh oleh Peneliti untuk keperluan/penanganan masalah yang dihadapi peneliti
- Data Sekunder:
- – Data yang diperoleh bukan dari Peneliti untuk keperluan/penanganan masalah tertentu.
- – Bisa dipakai oleh Peneliti bila dapat digunakan dalam penelitian. 37 KEUNTUNGAN DATA SEKUNDER >Mendapatkan dengan biaya yang lebih murah dengan waktu lebih cepat.
- Mengidentifikasi problem
- Mendefinisikan problem
- Menemukan pendekatan pada problem
- Memformulasikan design penelitian
- Menjawab research question tertentu
- Mendukung kebenaran interpretasi data primer
- Data sekunder belum tentu sesuai dengan problem yang ditangani oleh Peneliti. Kalaupun bisa, terbatas hanya pada keperluan yang tertentu.
- Metode yang digunakan untuk mendapatkan data sekunder bisa saja tidak sesuai dengan yang diinginkan Peneliti.
- Data sekunder dengan akurasi yang rendah.
- Data sekunder sudah kadaluarsa
- Data sekunder tidak bisa langsung dipergunakan, karena bergantung kepada beberapa kondisi tertentu. 39 VARIABEL
- Variabel adalah karakteristik yang dapat diamati dari sesuatu (objek) dan mampu memberikan bermacam- macam nilai atau beberapa kategori.
- – Contoh: Berat adalah variabel, sebab semua objek beratnya tidak sama dan suatu objek dapat saja berubah-ubah dari waktu ke waktu.
- – Contoh lain : Umur, nilai, kemajuan belajar, jenis kelamin, kecepatan, kekuatan
- VARIABEL KUANTITATIF VS KUALITATIF
- VARIABEL DISKRIT VS VARIABEL KONTINUE
- VARIABEL DEPENDEN VS VARIABEL BEBAS
- VARIABEL AKTIF VS VARIABEL ATRIBUT
- TINGKAT NOMINAL
- Data-data pada tingkat pengukuran ini bersifat (1) klasifikasi, (2) tidak berurutan (3) bukan numerik (4) Perbedaan antara nila tidak tetap.
- – Contoh: Warna mobile phone: perak, kuning, merah,
- Data-data pada tingkat pengukuran ini bersifat (1) memiliki urutan, (2) bukan numerik (3) Perbedaan antara nila tidak tetap Contoh: Kualitas mobile phone: 1=buruk, 2=sedang, 3=baik.
- TINGKAT INTERVAL
- Data-data pada tingkat pengukuran ini bersifat (1) memiliki urutan, (2) numerik (3) Perbedaan masing-masing nilai adalah tetap (3) Nilai 0 tidak memiliki arti (4) tidak bisa dibandingkan. Contoh: Suhu.
- TINGKAT RASIO
- Tingkat ini adalah tingkat tertinggi. Data-data pada tingkat pengukuran ini bersifat (1) memiliki urutan, (2) numerik (3) Perbedaan masing-masing nilai adalah tetap (3) Nilai 0 memiliki arti ketiadaan (4) bisa dibandingkan.
- Skala comparatif:
- – SKALA PAIRED COMPARISON
- – SKALA RANK ORDER
- – CONSTANT SUM
- – Q-SORT
- Skala non-comparatif
- – CONTINUOUS RATING SCALES
- – ITEMIZED RATING SCALES
- skala Likert • Semantic DifferEntial • Stapel. 43 HOMEWORK
- CARI DEFINISI, DAN BERIKAN CONTOH MASING-
Week#1: Make a group of max 10 students * Week#2: Submit a topic * Week#3: Start Making Questionnaire Draft Week#4: Consult your questionnaire draft* Week#5: Test your questionnaire Week#6: Final Questionnaire * Week#7: Start Data Collection UTS: - Week#8: Continue Data Collection* Week#9: - Week#10: Data Analysis 1* Week#11: - Week#12: Data Analysis 2* Week#13: - Week#14: Project Presentation & SAS Lab Test UAS: Submit your report+softcopy
UAS
STATISTIKA
7 JENIS-JENIS STATISTIKA
JENIS-JENIS STATISTIKA
SAMPEL
11 FAKTOR-FAKTOR PENENTU SAMPEL REPRESENTATIF
Tingkat representatif sampel secara umum dapat ditentukan oleh beberapa hal sebagai berikut: 1) Homogenitas populasi. 2) Jumlah (besar) sampel yang dipilih. 3) Banyaknya karakteristik subjek yang akan dipilih. 4) Ketepatan teknik pemilihan sampel.
ALASAN PENGAMBILAN SAMPEL
SAMPEL ACAK
SAMPLING
SAMPLING
SAMPEL ACAK SISTEMATIS
k dari populasi.
17 STRATIFIED RANDOM SAMPLING
PROPORTIONAL STRATIFIED RANDOM SAMPLING • Misalnya, populasi adalah karyawan PT. XYZ berjumlah 125.
Populasi sendiri terbagi ke dalam tiga bagian : Marketing : 15 Produksi : 75 Penjualan : 35
S2 : 10 orang
KASUS
CONTOH DALAM GAMBAR Populasi N= 324 rumah tangga akan diambil 27 rumah tangga
Gambar 1 SRS Gambar 2 Cluster
KEUNTUNGAN CLUSTER SAMPLING
KEKURANGAN CLUSTER SAMPLING
25 SAMPEL TIDAK ACAK/ NON RANDOM SAMPLING
1. Convenience sampling: subjektif Peneliti
2. Judgment sampling: Kemampuan anggota sampel
3. Quota sampling: Terbatas sebesar kuota
4. Snowball sampling: Rekomendasi member sebelumnya.
CONVENIENCE SAMPLING
MAU berpartisipasi, dekat rumah, teman, saudara dll.
JUDGMENT SAMPLING
KUOTA SAMPLING
SNOWBALL SAMPLING
SYARAT SAMPEL YANG BAIK
31 PEDOMAN PENGAMBILAN SAMPEL
UKURAN MINIMAL SAMPEL
HOMEWORK
UKURAN SAMPEL!
35 DATA
JENIS-JENIS DATA
KELEMAHAN DATA SEKUNDER
JENIS-JENIS VARIABEL
41 TINGKATAN PENGUKURAN (LEVEL OF MEASUREMENT)
SKALA DATA
MASING SKALA DATA