Bab 1 Pendahuluan Statistik

(1)

PROBABILITAS &

STATISTIKA

D R . A U D I T Y A


(2)

Measuring

Uncertainty

Quantifying

Uncertainty

Making

Decision Under

Uncertainty


(3)

CONTOH

Lama waktu dan kapasitas disk saat meng-install software Memory yang digunakan saat suatu program komputer

dijalankan

Saat-saat virus menyerang suatu sistem dan banyaknya kerusakan file akibat serangan tersebut

Peluncuran satelit tertunda akibat cuaca buruk (yang awalnya diprediksi baik)

Situasi lalu lintas Dll


(4)

PROBABILITAS & STATISTIK

CONTOH

MASALAH

Suatu folder terdiri atas 50 files. Ketika suatu virus menyerang folder tersebut,

kemungkinan tiap file terserang virus sebesar 0,2. Hitunglah probabilitas lebih dari 15 file

terserang virus tersebut.

Suatu folder terdiri atas 50 files. Ketika suatu virus menyerang folder tersebut, setiap file akan

terkontaminasi virus tersebut dengan probabilitas sebesar p. Sebelumnya telah diamati bahwa 15 files telah terkontaminasi, estimasikanlah besarnya nilai p. Apakah ada indikasi kuat p lebih besar dari 0,2 jika lebih dari


(5)

(6)

(7)

DEFINISI

Statistik diartikan

Numerical description

= deskripsi numerik

Diasosiasikan sebagai kumpulan data

Ciri dari sebagian objek yang diamati

Statistik menunjukan pada informasi tentang

bermacam-macam kegiatan dalam bentuk

angka


(8)

DEFINISI STATISTIK

 Menurut Schaum’s ; Murray R Spiegel  Ilmu

pengetahuan yang berhubungan dengan metode – metode ilmiah untuk pengumpulan,

pengorganisasian, perangkuman dan penganalisisan data di samping terkait pula dengan metode –

metode untuk penarikan kesimpulan yang valid serta pengambilan keputusan yang berdasarkan alasan-alasan yang ilmiah dan kuat yang memperoleh dari hasil analisis tadi

▫ Menurut Random House College of Dictionary  ilmu yang berhubungan dengan pengumpulan, pengklasifikasian, analisis, dan interpretasi fakta numerik atau data


(9)

KEGUNAAN

Analisis data

Peramalan/prediksi

Uji hipotesa

• Seorang programmer ingin mengetahui apakah anti virus buatannya baru efektif menghadang serangan virus?

• Seberapa efisien konsumsi BBM pada jenis mobil tertentu?

• Bagaimana menerjemahkan hasil polling? Berapa banyak sampel diperlukan agar hasilnya akurat? Apa artinya margin of error?


(10)

(11)

MENGAPA PERLU BELAJAR STATISTIK?

Menjelaskan hubungan antar variabel Membuat keputusan lebih baik

Mengatasi perubahan-perubahan Membuat rencana dan ramalan

• “It’s remarkable that a science which began with the consideration of games of chance should become the most important object of human knowledge …. The most important questions of life are, for the most part, really only problems of probability “ Pierre Simon, Marquis de Laplace

• “Statistical thingking will one day be as necessary for efficient citizenship as the ability to read an write.” H.G Wells


(12)

KITA DIBOMBARDIR DENGAN

STATISTIK

http://www.bps.go.id/brs_file/sbh_02jan14.pdf

http://www.gatra.com/hukum-1/44540-pada-2013,-23-385-tewas-kecelakaan-lalu-lintas.html

http://nationalgeographic.co.id/berita/2014/06/orang-indonesia-paling-bahagia-saat-tinggal-di-kota-berpendapatan-tinggi-berkeluarga


(13)

Iklan menyatakan:

“8 dari 10 wanita memilih shampoo Pantene”

Apa yang salah dari pernyataan ini?


(14)

INTERNET PENUH DENGAN

STATISTIK


(15)

STATISTIK DALAM KEHIDUPAN

SEHARI-HARI

Seiring meningkatnya data yang tersedia dan

perkembangan teknologi (komputer),

statistik akan digunakan lebih banyak dan

lebih sering lagi

Question:

Is it good that statistics

are used so much and what

happens when statistics are

misused

?


(16)

(17)

PEMBAGIAN ILMU STATISTIK

Statistik deskriptif

 statistik yang digunakan untuk

menggambarkan berbagai karakteristik data atau menganalisis suatu statistik hasil penelitian, tetapi tidak digunakan untuk


(18)

41 39 88 81 60 8 22 35 95 2 49 72 10 84 7 76 51 80 8 15 5 33 29 75 1 38 6 49 60 63 64 43 93 42 71 32 33 91 2 43 51 90 69 75 6 23 14 2 78 81 39 39 13 67 42 51 36 63 29 41 82 33 96 57 83 94 16 77 76 60 74 13 82 16 37 52 43 81 27 93 81 28 39 53 45 86 15 23 32 43 46 29 97 98 24 47 27 40 41 35 27 47 36 95 37 87 8 88 79 79 14 47 97 56 78 13 47 2 0 94 53 31 4 57 84 16 6 24 76 23 52 60 57 24 25 59 20 65 66 36 88 63 48 16 91 24 15 33 99 79 95 31 75 17 60 68 20 28 21 74 73 42 35 62 56 61 67 80 18 73 12 51 32 35 80 65 16 20 78 46 43 96 81 25 31 3 9 5 24 2 67 20 76 36 3 88 74 51 8 18 2 99 68 88 80 55 45 18 59 99 50 13 18 63 39 22 98 48 45 55 85 59 58 6 33 4 11 33 82 27 89 80 76 7 40 45 68 19 54 91 4 25 70 96 58 11 77 38 26 62 66 33 26 90 5 80 97 2 81 91 32 41 74 76 99 46 65 64 84 47 6 11 97 33 11 92 43 83 49 5 33 8 40 30 76 60 80 51 65 18 79 26 68 29 35 23 36 15 31 77 74 31 64 30 53 90 65 58 45 13 61 34 80 32 40 6 56 60 12 51 46 94 6 78 81 4 70 59 61 80 70 94 90 8 27 96 48 27 87 53 92 52 18 85 44 31 28 48 1 24 33 38 57 62 50 26 26 22 50 65 80 73 86 3 100 45 90 50


(19)

Statistik inferensial suatu pernyataan mengenai suatu

populasi yang didasarkan pada informasi dari sampel random /acak yang diambil dari populasi tersebut .


(20)

1. Data dari 1-2 kasus

2. Data yang dikumpulkan tidak jelas apakah mewakili populasi sebenarnya

1. Saya kenal dua orang mahasiswa UWP yang lulus sarjana lebih dari 6 tahun, jadi kuliah di UWP lulusnya lebih lama dibanding PTS lain

2. Ayahnya sahabat saya menderita sesak napas dan meninggal setelah diberi suntikan dokter, berarti terjadi malpraktik.


(21)

Statistik

Deskriptif

Inferensial

Estimasi

Titik Interval

Uji


(22)

METODOLOGI STATISTIK

Mengidentifikasikan persoalan

Pengumpulan fakta-fakta yang ada

Mengumpulkan data asli yang baru

Klasifikasi data Penyajian data Analisis data


(23)

(24)

ELEMEN STATISTIK

A. Populasi

B. Sampel

C. Variabel

Contoh

Observasi vs

Eksperimen


(25)

A. POPULASI

Populasi adalah sebagai sekumpulan dari semua objek atau individu yang memiliki karakteristik tertentu, jelas dan lengkap yang akan diteliti

Contoh :

Semua produk yang dihasilkan pada suatu mesin

Semua mahasiswa teknik industri di Surabaya

Populasi lebih bergantung pada

kegunaan dan relevansi data yang

dikumpulkan


(26)

B. SAMPEL

Sampel adalah sebagai sekumpulan data yang diambil atau diseleksi dari suatu populasi

Contoh :

 Populasi = Seluruh mahasiswa teknik informatika di Surabaya

maka sampelnya  mengambil beberapa mahasiswa teknik

informatika dari 1 PTN dan 5 PTS di Surabaya

 Populasi =Semua produk yang dihasilkan suatu mesin, maka

sampelnya adalah sejumlah tertentu produk yang dihasilkan mesin tersebut


(27)

(28)

LESSON LEARNED?

Sampel bersama dengan statistik inferensi memungkinkan kita mengambil kesimpulan tentang populasi

Elemen dalam probabilitas memungkinkan kita mengambil kesimpulan mengenai karakteristik dari dugaan/hipotesis

mengenai populasi berdasarkan sifat-sifat populasi yang telah diketahui sebelumnya

Hubungan Fundamental antara

Probabilitas dan Statistik Inferensi

• Aplikasi dari probabilitas adalah penting dalam menginterpretasikan statistik inferensi

CENTRAL DOGMA OF STATISTICS


(29)

Studi

Observasi

•Mengumpulkan data melalui pengamatan

•Hanya dapat

membantuk suatu hubungan antara variabel penjelas (explanatory) dan variabel respon

•Jika menggunakan data masa lampau disebut retrospective, jika dikumpulkan selama masa penelitian disebut prospective

Eksperime

n

• Secara acak

menempatkan subyek dalam berbagai

treatment

• Dapat membangun hubungan kausal

(sebab akibat) antara variabel explanatory dan variabel respon


(30)

(31)

(32)

MENGAPA SAMPLING? MENGAPA BUKAN

SENSUS

Beberapa individu sukar dijangkau atau diukur Populasi jarang statis

Bukankah lebih baik jika melibatkan seluruh orang dan mengambil sampel seluruh populasi? = SENSUS


(33)

(34)

SUMBER DARI BIAS DALAM SAMPLING

Convenience sample. Individual yang mudah

diakses dan cenderung mau dilibatkan dalam sampel

Non-response: jika hanya suatu fraction (yang tidak random) dari orang-orang yang disampling

secara acak bersedia terlibat dalam suatu survei sehingga sampel akhir tidak representasi dari

suatu populasi lagi

Voluntary response: Terjadi jika sampel terdiri atas orang-orang yang bersedia menjawab karena mereka memiliki kepentingan atau opini yang kuat terhadap suatu isu


(35)

METODE SAMPLING

Simple Random Sampling: Memilih kasus (cases) dari

suatu populasi sedemikian hingga setiap kasus mendapat kesempatan yang sama untuk terpilih


(36)

Stratified Sampling. Membagi populasi ke dalam

strata yang homogen lalu memilih sampel secara random dalam strata tersebut


(37)

Cluster Sampling. Membagi populasi ke dalam

cluster-cluster lalu memilih beberapa cluster secara random. Selanjutnya mengambil secara acak


(38)

STUDI/PENELITIAN

EKSPERIMEN


(39)

PRINSIP-PRINSIP DALAM RANCANGAN

EKSPERIMEN

1. Control. Membandingkan suatu perlakuan

(treatment) dengan kelompok kontrol

2. Randomize. Menempatkan subyek secara acak ke kelompok perlakuan.

3. Replicate. Mereplikasi suatu studi dalam sampel cukup besar atau mereplikasi keseluruhan studi (kasus the hidden messages in water

http://is-masaru-emoto-for-real.com/

4. Block. Jika dicurigai ada variabel-variabel yang dapat mempengaruhi variabel respon, maka

kelompokkan terlebih dahulu subyek ke dalam blok2 berdasarkan variabel-variabel ini lalu

randomisasi kasus2 dalam setiap blok untuk tiap kelompok perlakuan


(40)

CONTOH BLOCKING

Kita ingin merancang eksperimen apakah pemberian suplemen tertentu membuat orang berlari lebih

cepat

Kelompok perlakuan (treatment) : suplemen

Kelompok kontrol : tanpa suplement

Jika dicurigai suplemen tersebut mempengaruhi kelompok atlet profesional dan amatir secara berbeda, maka kita perlu mem-blok status

pro/amatir tersebut

Membagi sampel menjadi kelompok pro dan amatir

Secara acak membagi atlet yang pro dan amatir ke

dalam kelompok perlakuan dan control

Atlet pro dan amati secara berimbang terwakili dalam


(41)

BLOCKING VS VARIABEL

EXPLANATORY

Explanatory variables (atau terkadang disebut faktor) adalah kondisi yang kita tentukan pada unit

eksperimen

Blocking variables adalah karakteristik unit eksperimen yang ingin kita kontrol

Blocking mirip dengan stratifying, digunakan dalam situasi eksperimen


(42)

BEBERAPA TERMINOLOGI LAIN

DALAM RANCANGAN

EKSPERIMEN

Placebo: perlakuan “palsu” sering digunakan sebagai

kelompok kontrol dalam studi kesehatan

Placebo Effect: unit eksperimen menunjukkan peruabhan

karena percaya mereka telah mendapatkan suatu perlakuan

Blinding: unit eksperiment tidak mengetahui apakah

mereka sesungguhnya berada dalam kelompok kontrol atau perlakuan

Double-Blind: baik unit eksperimen maupun peneliti tidak

mengetahui siapa saja yang termasuk dalam kelompok kontrol maupun perlakuan


(43)

RANDOM SAMPLING VS


(44)

(45)

(46)

(47)

C

.

VARIABEL

Dalam melakukan inferensi terhadap populasi, tidak semua ciri populasi harus diketahui, hanya satu atau beberapa

karakteristik populasi yang perlu diketahui, yang disebut sebagai VARIABEL

Variabel adalah suatu sifat atau karakteristik dari beberapa obyek, kejadian, atau orang yang nilainya dapat bervariasi dan dapat dihitung atau diukur

Contoh:

 Jenis kelamin

 Usia

 Suku bangsa

 Tinggi badan

 Tingkat pendidikan

 Kecacatan produk (ya/tidak dalam contoh 1)


(48)

TIPE VARIABEL

Variabel

Numerik / Kuantitatif

Kontinu Diskrit

Kategori / Kualitatif


(49)

NUMERIK VS KATEGORI

• Menggambarkan kuantitas yang dapat diukur

• Dapat dilakukan operasi aritmetik seperti

penjumlahan, pengurangan, diambil rata-ratanya, dll

Numerik

• Nilai dari suatu nama atau label

• Kategori dapat

diidentifikasikan dengan angka tetapi tidak bisa

dilakukan operasi aritmetik

Kategori

Tinggi badan, temperatur,

banyaknya

mahasiswa, jumlah kk

Jenis kelamin, tingkat pendidikan, bentuk


(50)

• Variabel numerik yang dihitung dan hanya dapat bernilai utuh

• Contoh: banyaknya file yang terkontaminasi

virus, banyaknya

kemunculan angka 2 dalam pelemparan dadu, jumlah anak dalam satu keluarga

• Variabel numerik yang dapat diukur dan dapat bernilai sembarang

• Contoh: kekuatan tarik suatu jenis material,

lama proses loading

sistem, panjang antrian

Numerik


(51)

(52)

CONTOH VARIABEL KONTINU

Tinggi seseorang yang dapat bernilai 62

cm, 67,5 cm atau 68,45678 cm, bergantung

pada tingkat akurasi pengukurannya

Jumlah anak dalam sebuah keluarga,

yang bernilai bsa salah satu dari 0, 1, 2, 3,

tetapi tidak mungkin 2,5 atau, 3,4567


(53)

• Variabel kategori yang tidak berurut disebut variabel kategori saja

• Contoh: jenis kelamin, merek televisi yang dimiliki

• Variabel kategori

yang memiliki urutan

• Contoh: tingkat

kepuasan pelanggan, ranking merek mobil favorit

Kategori


(1)

TIPE VARIABEL

Variabel

Numerik / Kuantitatif

Kontinu Diskrit

Kategori / Kualitatif


(2)

NUMERIK VS KATEGORI

• Menggambarkan kuantitas yang dapat diukur

• Dapat dilakukan operasi aritmetik seperti

penjumlahan, pengurangan, diambil rata-ratanya, dll

Numerik

• Nilai dari suatu nama atau label

• Kategori dapat

diidentifikasikan dengan angka tetapi tidak bisa

dilakukan operasi aritmetik

Kategori

Tinggi badan, temperatur,

banyaknya

mahasiswa, jumlah kk

Jenis kelamin, tingkat pendidikan, bentuk


(3)

• Variabel numerik yang dihitung dan hanya dapat bernilai utuh

• Contoh: banyaknya file yang terkontaminasi

virus, banyaknya

kemunculan angka 2 dalam pelemparan dadu, jumlah anak dalam satu keluarga

• Variabel numerik yang dapat diukur dan dapat bernilai sembarang

• Contoh: kekuatan tarik suatu jenis material,

lama proses loading

sistem, panjang antrian

Numerik


(4)

(5)

CONTOH VARIABEL KONTINU

Tinggi seseorang yang dapat bernilai 62

cm, 67,5 cm atau 68,45678 cm, bergantung

pada tingkat akurasi pengukurannya

Jumlah anak dalam sebuah keluarga,

yang bernilai bsa salah satu dari 0, 1, 2, 3,

tetapi tidak mungkin 2,5 atau, 3,4567


(6)

• Variabel kategori yang tidak berurut disebut variabel kategori saja

• Contoh: jenis kelamin, merek televisi yang dimiliki

• Variabel kategori

yang memiliki urutan

• Contoh: tingkat

kepuasan pelanggan, ranking merek mobil favorit

Kategori