Bab 1 Pendahuluan Statistik
PROBABILITAS &
STATISTIKA
D R . A U D I T Y A
(2)
Measuring
Uncertainty
Quantifying
Uncertainty
Making
Decision Under
Uncertainty
(3)
CONTOH
• Lama waktu dan kapasitas disk saat meng-install software • Memory yang digunakan saat suatu program komputer
dijalankan
• Saat-saat virus menyerang suatu sistem dan banyaknya kerusakan file akibat serangan tersebut
• Peluncuran satelit tertunda akibat cuaca buruk (yang awalnya diprediksi baik)
• Situasi lalu lintas • Dll
(4)
PROBABILITAS & STATISTIK
–
CONTOH
MASALAH
Suatu folder terdiri atas 50 files. Ketika suatu virus menyerang folder tersebut,
kemungkinan tiap file terserang virus sebesar 0,2. Hitunglah probabilitas lebih dari 15 file
terserang virus tersebut.
Suatu folder terdiri atas 50 files. Ketika suatu virus menyerang folder tersebut, setiap file akan
terkontaminasi virus tersebut dengan probabilitas sebesar p. Sebelumnya telah diamati bahwa 15 files telah terkontaminasi, estimasikanlah besarnya nilai p. Apakah ada indikasi kuat p lebih besar dari 0,2 jika lebih dari
(5)
(6)
(7)
DEFINISI
Statistik diartikan
Numerical description
= deskripsi numerik
Diasosiasikan sebagai kumpulan data
Ciri dari sebagian objek yang diamati
Statistik menunjukan pada informasi tentang
bermacam-macam kegiatan dalam bentuk
angka
(8)
DEFINISI STATISTIK
Menurut Schaum’s ; Murray R Spiegel Ilmu
pengetahuan yang berhubungan dengan metode – metode ilmiah untuk pengumpulan,
pengorganisasian, perangkuman dan penganalisisan data di samping terkait pula dengan metode –
metode untuk penarikan kesimpulan yang valid serta pengambilan keputusan yang berdasarkan alasan-alasan yang ilmiah dan kuat yang memperoleh dari hasil analisis tadi
▫ Menurut Random House College of Dictionary ilmu yang berhubungan dengan pengumpulan, pengklasifikasian, analisis, dan interpretasi fakta numerik atau data
(9)
KEGUNAAN
Analisis data
Peramalan/prediksi
Uji hipotesa
• Seorang programmer ingin mengetahui apakah anti virus buatannya baru efektif menghadang serangan virus?
• Seberapa efisien konsumsi BBM pada jenis mobil tertentu?
• Bagaimana menerjemahkan hasil polling? Berapa banyak sampel diperlukan agar hasilnya akurat? Apa artinya margin of error?
(10)
(11)
MENGAPA PERLU BELAJAR STATISTIK?
Menjelaskan hubungan antar variabel Membuat keputusan lebih baik
Mengatasi perubahan-perubahan Membuat rencana dan ramalan
• “It’s remarkable that a science which began with the consideration of games of chance should become the most important object of human knowledge …. The most important questions of life are, for the most part, really only problems of probability “ Pierre Simon, Marquis de Laplace
• “Statistical thingking will one day be as necessary for efficient citizenship as the ability to read an write.” H.G Wells
(12)
KITA DIBOMBARDIR DENGAN
STATISTIK
http://www.bps.go.id/brs_file/sbh_02jan14.pdf
http://www.gatra.com/hukum-1/44540-pada-2013,-23-385-tewas-kecelakaan-lalu-lintas.html
http://nationalgeographic.co.id/berita/2014/06/orang-indonesia-paling-bahagia-saat-tinggal-di-kota-berpendapatan-tinggi-berkeluarga
(13)
Iklan menyatakan:
“8 dari 10 wanita memilih shampoo Pantene”
Apa yang salah dari pernyataan ini?
(14)
INTERNET PENUH DENGAN
STATISTIK
(15)
STATISTIK DALAM KEHIDUPAN
SEHARI-HARI
Seiring meningkatnya data yang tersedia dan
perkembangan teknologi (komputer),
statistik akan digunakan lebih banyak dan
lebih sering lagi
Question:
Is it good that statistics
are used so much and what
happens when statistics are
misused
?
(16)
(17)
PEMBAGIAN ILMU STATISTIK
•
Statistik deskriptif
statistik yang digunakan untukmenggambarkan berbagai karakteristik data atau menganalisis suatu statistik hasil penelitian, tetapi tidak digunakan untuk
(18)
41 39 88 81 60 8 22 35 95 2 49 72 10 84 7 76 51 80 8 15 5 33 29 75 1 38 6 49 60 63 64 43 93 42 71 32 33 91 2 43 51 90 69 75 6 23 14 2 78 81 39 39 13 67 42 51 36 63 29 41 82 33 96 57 83 94 16 77 76 60 74 13 82 16 37 52 43 81 27 93 81 28 39 53 45 86 15 23 32 43 46 29 97 98 24 47 27 40 41 35 27 47 36 95 37 87 8 88 79 79 14 47 97 56 78 13 47 2 0 94 53 31 4 57 84 16 6 24 76 23 52 60 57 24 25 59 20 65 66 36 88 63 48 16 91 24 15 33 99 79 95 31 75 17 60 68 20 28 21 74 73 42 35 62 56 61 67 80 18 73 12 51 32 35 80 65 16 20 78 46 43 96 81 25 31 3 9 5 24 2 67 20 76 36 3 88 74 51 8 18 2 99 68 88 80 55 45 18 59 99 50 13 18 63 39 22 98 48 45 55 85 59 58 6 33 4 11 33 82 27 89 80 76 7 40 45 68 19 54 91 4 25 70 96 58 11 77 38 26 62 66 33 26 90 5 80 97 2 81 91 32 41 74 76 99 46 65 64 84 47 6 11 97 33 11 92 43 83 49 5 33 8 40 30 76 60 80 51 65 18 79 26 68 29 35 23 36 15 31 77 74 31 64 30 53 90 65 58 45 13 61 34 80 32 40 6 56 60 12 51 46 94 6 78 81 4 70 59 61 80 70 94 90 8 27 96 48 27 87 53 92 52 18 85 44 31 28 48 1 24 33 38 57 62 50 26 26 22 50 65 80 73 86 3 100 45 90 50
(19)
Statistik inferensial suatu pernyataan mengenai suatu
populasi yang didasarkan pada informasi dari sampel random /acak yang diambil dari populasi tersebut .
(20)
1. Data dari 1-2 kasus
2. Data yang dikumpulkan tidak jelas apakah mewakili populasi sebenarnya
1. Saya kenal dua orang mahasiswa UWP yang lulus sarjana lebih dari 6 tahun, jadi kuliah di UWP lulusnya lebih lama dibanding PTS lain
2. Ayahnya sahabat saya menderita sesak napas dan meninggal setelah diberi suntikan dokter, berarti terjadi malpraktik.
(21)
Statistik
Deskriptif
Inferensial
Estimasi
Titik Interval
Uji
(22)
METODOLOGI STATISTIK
Mengidentifikasikan persoalan
Pengumpulan fakta-fakta yang ada
Mengumpulkan data asli yang baru
Klasifikasi data Penyajian data Analisis data
(23)
(24)
ELEMEN STATISTIK
A. Populasi
B. Sampel
C. Variabel
•
Contoh
•
Observasi vs
Eksperimen
(25)
A. POPULASI
Populasi adalah sebagai sekumpulan dari semua objek atau individu yang memiliki karakteristik tertentu, jelas dan lengkap yang akan diteliti
Contoh :
Semua produk yang dihasilkan pada suatu mesin
Semua mahasiswa teknik industri di Surabaya
Populasi lebih bergantung pada
kegunaan dan relevansi data yang
dikumpulkan
(26)
B. SAMPEL
Sampel adalah sebagai sekumpulan data yang diambil atau diseleksi dari suatu populasi
Contoh :
Populasi = Seluruh mahasiswa teknik informatika di Surabaya
maka sampelnya mengambil beberapa mahasiswa teknik
informatika dari 1 PTN dan 5 PTS di Surabaya
Populasi =Semua produk yang dihasilkan suatu mesin, maka
sampelnya adalah sejumlah tertentu produk yang dihasilkan mesin tersebut
(27)
(28)
LESSON LEARNED?
Sampel bersama dengan statistik inferensi memungkinkan kita mengambil kesimpulan tentang populasi
Elemen dalam probabilitas memungkinkan kita mengambil kesimpulan mengenai karakteristik dari dugaan/hipotesis
mengenai populasi berdasarkan sifat-sifat populasi yang telah diketahui sebelumnya
Hubungan Fundamental antara
Probabilitas dan Statistik Inferensi
• Aplikasi dari probabilitas adalah penting dalam menginterpretasikan statistik inferensi
CENTRAL DOGMA OF STATISTICS
(29)
Studi
Observasi
•Mengumpulkan data melalui pengamatan
•Hanya dapat
membantuk suatu hubungan antara variabel penjelas (explanatory) dan variabel respon
•Jika menggunakan data masa lampau disebut retrospective, jika dikumpulkan selama masa penelitian disebut prospective
Eksperime
n
• Secara acakmenempatkan subyek dalam berbagai
treatment
• Dapat membangun hubungan kausal
(sebab akibat) antara variabel explanatory dan variabel respon
(30)
(31)
(32)
MENGAPA SAMPLING? MENGAPA BUKAN
SENSUS
Beberapa individu sukar dijangkau atau diukur Populasi jarang statis
Bukankah lebih baik jika melibatkan seluruh orang dan mengambil sampel seluruh populasi? = SENSUS
(33)
(34)
SUMBER DARI BIAS DALAM SAMPLING
Convenience sample. Individual yang mudahdiakses dan cenderung mau dilibatkan dalam sampel
Non-response: jika hanya suatu fraction (yang tidak random) dari orang-orang yang disampling
secara acak bersedia terlibat dalam suatu survei sehingga sampel akhir tidak representasi dari
suatu populasi lagi
Voluntary response: Terjadi jika sampel terdiri atas orang-orang yang bersedia menjawab karena mereka memiliki kepentingan atau opini yang kuat terhadap suatu isu
(35)
METODE SAMPLING
Simple Random Sampling: Memilih kasus (cases) dari
suatu populasi sedemikian hingga setiap kasus mendapat kesempatan yang sama untuk terpilih
(36)
Stratified Sampling. Membagi populasi ke dalam
strata yang homogen lalu memilih sampel secara random dalam strata tersebut
(37)
Cluster Sampling. Membagi populasi ke dalam
cluster-cluster lalu memilih beberapa cluster secara random. Selanjutnya mengambil secara acak
(38)
STUDI/PENELITIAN
EKSPERIMEN
(39)
PRINSIP-PRINSIP DALAM RANCANGAN
EKSPERIMEN
1. Control. Membandingkan suatu perlakuan
(treatment) dengan kelompok kontrol
2. Randomize. Menempatkan subyek secara acak ke kelompok perlakuan.
3. Replicate. Mereplikasi suatu studi dalam sampel cukup besar atau mereplikasi keseluruhan studi (kasus the hidden messages in water
http://is-masaru-emoto-for-real.com/
4. Block. Jika dicurigai ada variabel-variabel yang dapat mempengaruhi variabel respon, maka
kelompokkan terlebih dahulu subyek ke dalam blok2 berdasarkan variabel-variabel ini lalu
randomisasi kasus2 dalam setiap blok untuk tiap kelompok perlakuan
(40)
CONTOH BLOCKING
Kita ingin merancang eksperimen apakah pemberian suplemen tertentu membuat orang berlari lebih
cepat
Kelompok perlakuan (treatment) : suplemen
Kelompok kontrol : tanpa suplement
Jika dicurigai suplemen tersebut mempengaruhi kelompok atlet profesional dan amatir secara berbeda, maka kita perlu mem-blok status
pro/amatir tersebut
Membagi sampel menjadi kelompok pro dan amatir
Secara acak membagi atlet yang pro dan amatir ke
dalam kelompok perlakuan dan control
Atlet pro dan amati secara berimbang terwakili dalam
(41)
BLOCKING VS VARIABEL
EXPLANATORY
Explanatory variables (atau terkadang disebut faktor) adalah kondisi yang kita tentukan pada unit
eksperimen
Blocking variables adalah karakteristik unit eksperimen yang ingin kita kontrol
Blocking mirip dengan stratifying, digunakan dalam situasi eksperimen
(42)
BEBERAPA TERMINOLOGI LAIN
DALAM RANCANGAN
EKSPERIMEN
Placebo: perlakuan “palsu” sering digunakan sebagai
kelompok kontrol dalam studi kesehatan
Placebo Effect: unit eksperimen menunjukkan peruabhan
karena percaya mereka telah mendapatkan suatu perlakuan
Blinding: unit eksperiment tidak mengetahui apakah
mereka sesungguhnya berada dalam kelompok kontrol atau perlakuan
Double-Blind: baik unit eksperimen maupun peneliti tidak
mengetahui siapa saja yang termasuk dalam kelompok kontrol maupun perlakuan
(43)
RANDOM SAMPLING VS
(44)
(45)
(46)
(47)
C
.
VARIABEL
Dalam melakukan inferensi terhadap populasi, tidak semua ciri populasi harus diketahui, hanya satu atau beberapa
karakteristik populasi yang perlu diketahui, yang disebut sebagai VARIABEL
Variabel adalah suatu sifat atau karakteristik dari beberapa obyek, kejadian, atau orang yang nilainya dapat bervariasi dan dapat dihitung atau diukur
Contoh:
Jenis kelamin
Usia
Suku bangsa
Tinggi badan
Tingkat pendidikan
Kecacatan produk (ya/tidak dalam contoh 1)
(48)
TIPE VARIABEL
Variabel
Numerik / Kuantitatif
Kontinu Diskrit
Kategori / Kualitatif
(49)
NUMERIK VS KATEGORI
• Menggambarkan kuantitas yang dapat diukur
• Dapat dilakukan operasi aritmetik seperti
penjumlahan, pengurangan, diambil rata-ratanya, dll
Numerik
• Nilai dari suatu nama atau label
• Kategori dapat
diidentifikasikan dengan angka tetapi tidak bisa
dilakukan operasi aritmetik
Kategori
Tinggi badan, temperatur,
banyaknya
mahasiswa, jumlah kk
Jenis kelamin, tingkat pendidikan, bentuk
(50)
• Variabel numerik yang dihitung dan hanya dapat bernilai utuh
• Contoh: banyaknya file yang terkontaminasi
virus, banyaknya
kemunculan angka 2 dalam pelemparan dadu, jumlah anak dalam satu keluarga
• Variabel numerik yang dapat diukur dan dapat bernilai sembarang
• Contoh: kekuatan tarik suatu jenis material,
lama proses loading
sistem, panjang antrian
Numerik
(51)
(52)
CONTOH VARIABEL KONTINU
•
Tinggi seseorang yang dapat bernilai 62
cm, 67,5 cm atau 68,45678 cm, bergantung
pada tingkat akurasi pengukurannya
•
Jumlah anak dalam sebuah keluarga,
yang bernilai bsa salah satu dari 0, 1, 2, 3,
…
tetapi tidak mungkin 2,5 atau, 3,4567
(53)
• Variabel kategori yang tidak berurut disebut variabel kategori saja
• Contoh: jenis kelamin, merek televisi yang dimiliki
• Variabel kategori
yang memiliki urutan
• Contoh: tingkat
kepuasan pelanggan, ranking merek mobil favorit
Kategori
(1)
TIPE VARIABEL
Variabel
Numerik / Kuantitatif
Kontinu Diskrit
Kategori / Kualitatif
(2)
NUMERIK VS KATEGORI
• Menggambarkan kuantitas yang dapat diukur
• Dapat dilakukan operasi aritmetik seperti
penjumlahan, pengurangan, diambil rata-ratanya, dll
Numerik
• Nilai dari suatu nama atau label
• Kategori dapat
diidentifikasikan dengan angka tetapi tidak bisa
dilakukan operasi aritmetik
Kategori
Tinggi badan, temperatur,
banyaknya
mahasiswa, jumlah kk
Jenis kelamin, tingkat pendidikan, bentuk
(3)
• Variabel numerik yang dihitung dan hanya dapat bernilai utuh
• Contoh: banyaknya file yang terkontaminasi
virus, banyaknya
kemunculan angka 2 dalam pelemparan dadu, jumlah anak dalam satu keluarga
• Variabel numerik yang dapat diukur dan dapat bernilai sembarang
• Contoh: kekuatan tarik suatu jenis material,
lama proses loading
sistem, panjang antrian
Numerik
(4)
(5)
CONTOH VARIABEL KONTINU
•
Tinggi seseorang yang dapat bernilai 62
cm, 67,5 cm atau 68,45678 cm, bergantung
pada tingkat akurasi pengukurannya
•
Jumlah anak dalam sebuah keluarga,
yang bernilai bsa salah satu dari 0, 1, 2, 3,
…
tetapi tidak mungkin 2,5 atau, 3,4567
(6)
• Variabel kategori yang tidak berurut disebut variabel kategori saja
• Contoh: jenis kelamin, merek televisi yang dimiliki
• Variabel kategori
yang memiliki urutan
• Contoh: tingkat
kepuasan pelanggan, ranking merek mobil favorit
Kategori