Statistika adalah ilmu yang berkaitan dengan
PENGANTAR
STATISTIKA INDUSTRI
Statistika
Statistika : Defnisi & Tujuan Statistika adalah ilmu yang berkaitan dengan
pengumpulan,
pengolahan,
presentasi (deskritif), dan
interpretasi (inferensi) data
Secara ilmiah dalam kerangka proses pengambilan keputusan yang berkaitan
dengan adanya ketidakpastian (resiko) dan variasi .
Statistika Deskriptif vs Inferensi
Statistika deskriptif digunakan apabila peneliti hanya bertujuan mendapatkan ringkasan data yang dimilikinya. Ringkasan ini meliputi lokasi pemusatan data, variabilitas data, dan karakteristik umum distribusi data.
Statistika inferensi digunakan apabila peneliti
ingin membuat suatu kesimpulan tertentu atas karakteristik/hubungan antar beberapa variabel dalam populasi, diberikan jika hanya memiliki data sampel.
Statistika Deskriptif vs Inferensi
Statistik Statistik Inferensi
- Memperkirakan dan
Deskriptif
meramalkan nilai Collect
Organize parameter populasi
Summarize - Menguji hipotesis
Display tentang nilai
parameter populasi Analyze
Tidak
- Membuat keputusan
Tidak dilakukan dilakukan generalisasi generalisasi Inferensi Inferensi berdasarkan berdasarkan keterbatasan keterbatasan informasi sample informasi sample
Statistika Inferensi
- Statistika inferensi:
- – Menduga dan meramalkan
Berdasarkan statistik sampel (estimasi) nilai parameter yang diambil dari sejumlah populasi... terbatas (tidak lengkap)
- – Menguji hipotesis nilai parameter populasi...
informasi sampel
- – Mengambil keputusan...
Observasi pada Observasi pada sebagian populasi sebagian populasi
Melakukan Melakukan generalisasi terhadap generalisasi terhadap populasi... populasi...
Populasi vs Sampel Oleh karenanya, lingkup ‘data’ dapat dikategorikan sebagai: populasi merupakan kumpulan semua individu dari jenis objek yang menjadi perhatian penelitian, dan
sampel adalah bagian dari populasi yang dapat dikumpulkan oleh peneliti (sebatas kemampuannya dalam melakukan pengumpulan data).
Besaran populasi disebut parameter , sedangkan besaran sampel disebut statistik .
Statistik sebagai estimator parameter Estimator adalah statistik yang digunakan untuk mengestimasi parameter populasi. Estimasi dari sebuah parameter adalah nilai numerik tertentu (dari statistik sampel) yang diperoleh melalui sampling. Titik estimasi adalah sebuah nilai yang digunakan untuk mengestimasi sebuah parameter populasi. o
Statistik adalah ukuran karakteristik sampel. o
Parameter populasi
adalah ukuran karakteristik populasi .
Statistik vs Parameter
Distribusi dan rata-rata
Rata-rata populasi () Distribusi frekuensi populasi
X X X X X X X X X X X X X X Perbedaan antara X X X X rata-rata sampel dengan rata-rata populasi disebut bias
Titik sampel X Sample mean ( )
Proses Sampling & Inferensi
Kaitan populasi dan sampel, serta proses sampling, proses inferensi & statistika deskriptif: Populasi
Sampel Sampling Inferensi Statistika Deskriptif
Proses Sampling & Inferensi
Dapat disimpulkan bahwa statistika berkaitan dengan proses pengambilan sampel ( sampling ) sehingga dapat dilakukan penyajian dan peringkasan data ( statistika deskriptif ) atau lebih jauh lagi dilakukan pendugaan dan pengujian nilai parameter populasi ( statistika
inferensi ).
Sensus vs Sampling
Sebuah metoda survey yang mencakup seluruh anggota populasi disebut sensus . Sementara teknik untuk mengumpulkan informasi dari sebagian populasi disebut sampling. Sampel Random Sederhana
Sampling dari populasi dilakukan secara
random, sedemikian sehingga setiap sampel
berukuran sama (n) memiliki kesempatan yang sama untuk diambil atau dipilih Sebuah sampel yang diambil dengan cara tersebut disebut sebuah sampel random sederhana atau sample random.
Pengambilan Sampel
Pada statistika inferensi, pengambilan sampel menentukan hasil inferensi.
Idealnya sampel diambil secara random .
Pengambilan sampel yang tidak tepat
dapat menyebabkan bias systematic
errorPengambilan Sampel Setiap data sampel yang diambil dapat mencakup:
Nilai sebenarnya (true value),
Kesalahan sistematis, dan
Kesalahan acak (random).
Data sampel = true value
- kesalahan sistematis
- kesalahan acak
Pengambilan Sampel
Data sampel = true value
- kesalahan sistematis
- kesalahan acak
Statistika membantu peneliti untuk mengetahui komponen-komponen nilai data sampel tersebut.
Pengambilan Sampel
Data sampel selalu mengandung kesalahan karena adanya “ketidak-pastian (error)”,
2 Ekspektasi [error] = variansi + (bias)
Variansi (kesalahan acak) berkaitan dengan masalah kepresisian.
Bias (kesalahan sistematis) berkaitan dengan
masalah akurasi.Presisi ukuran seberapa jauh suatu tools memberi hasil yang konsisten variasi data coeficient standard error/koefsien kesalahan baku Akurasi: seberapa tepat suatu tools mengukur apa yang seharusnya diukur jarak yang diukur dari target ketepatan menentukan sample dalam menggambarkan karakteristik populasi Sample akurasi tinggi: kesimpulan dari sample menggambarkan karakteristik populasi.
Representative sample
Sample yang sebesar mungkin mewakili karakteristik populasi dikatakan sebagai representative sample.
Besarnya dugaan keterwakilan populasi dalam sampel dinyatakan dengan (1-α).
Notasi α selanjutnya disebut: tingkat keyakinan (confdence) dalam melakukan pendugaan atau estimasi, dan
tingkat pembedaan (signifcance) dalam melakukan pengujian hipotesis nilai parameter populasi (juga dikenal sebagai kesalahan tipe pertama).
Statistika dan permasalahannya
Kecil kemungkinan karakteristik sampel persis sama dengan karakteristik populasi.
Teori probabilitas membantu kita dalam
melakukan penarikan kesimpulan atas dugaan atau hipotetis yang terkait dengan karakteristik populasi.
Statistika dan permasalahannya
Peran statistika dan teori probabilitas dalam proses deduksi dan induksi:
Hipotesis 1 Deduksi Konsekuensi Modifkasi (hipotesis 2) Induksi Fenomena
Eksperimen Data
Statistika dan permasalahannya
Secara alamiah seorang anak dapat memiliki dugaan
( hipotesis 1 ) bahwa warna merah umumnya panas
dan warna biru umumnya dingin. Kemudian dia mendapat pengalaman ( deduksi ) bahwa ternyata api berwarna biru dari kompor gas lebih panas dari api berwarna merah ( konsekuensi ). Hal ini merubah dugaan awalnya ( induksi ) sehingga dia memperoleh dugaan baru ( hipotesis 2 ).Dengan cara ini manusia belajar secara alamiah dari pengalaman yang dihadapi.
Statistika dan permasalahannya
Proses deduksi & induksi ini dapat “diciptakan” melalui eksperimen dengan memanfaatkan statistika dan probabilitas sehingga dapat diperoleh data atau estimasi untuk mempercepat proses belajar (tidak perlu menunggu kejadian alamiah).
Statistika dan permasalahannya Kerangka pemikiran kesisteman dan statistika:
Proses Variasi Data Perbaikan
Kerangka kerja ini dikenal sebagai Statistical Thinking (Statistical Division ASQ) yang digunakan sebagai acuan dalam implementasi statistika di dunia nyata.
Falsafah kesisteman Analisis Tindakan & resiko
Skala pengukuran
Ada empat type skala, yaitu:
Nominal
Ordinal
Interval
Ratio
Skala pengukuran
Skala Nominal – group atau kelas
Jenis kelamin
Skala Ordinal – urutan
Ranking
Skala Interval – perbedaan, selisih, jarak
Temperatur
Skala Rasio – perbandingan
Ongkos per unit
Statistika Deskriptif distribusi frekuensi & ukuran statis tik
Presentasi Data
Grafik/diagram penyampaian informasi data
berupa angka secara visual
Line Chart/ Diagram Garis
Histograms/Diagram Batang
Frequency Polygon/Diagram Frekuensi
Ogives/Distribusi Frekuensi Kumulatif
Pie Chart/ Diagram Lingkaran
si 20 30 DIAGRAM GARIS
si
30 20 25 Grafik Histogram re F en ku 10F
en
ku
re
10 15 530.5 40.5 Grafilk Poligon Class Boundaries 50.5 60.5 70.5 80.5 30.5 - 40.5 40.5 - 50.5 50.5 - 60.5 60.5 - 70.5 70.5 - 80.5 80.5 - 90.5 Class Boundaries si 30 25 20 20 25 30 si 20 25 30 Kurva Frekuensi re F ku en 15 10 5 15 10 5 re en F ku 15 10 5 30.5 - 40.5 40.5 - 50.5 50.5 - 60.5 60.5 - 70.5 70.5 - 80.5 80.5 - 90.5 Class Boundaries 30.5 - 40.5 40.5 - 50.5 50.5- 60.5 60.5 - 70.5 70.5- 80.5 80.5 - 90. 5 Class Boundaries
40.5 30.5 80.5 70.5 60.5
50.5 Sifat Kelompok Data
Mutually exclusive tidak overlapping – sebuah observasi hanya ada dalam sebuah kelompok
Exhaustive
setiap observasi ditempatkan dalam sebuah
kelompok Equal-width (if possible) kelompok pertama dan terakhir dapat berbeda
Distribusi Frekuensi
Frekuensi dari setiap kelompok jumlah observasi dalam setiap kelompok
- Jumlah frekuensi adalah jumlah observasi,
- yaitu
N untuk populasi n untuk sampel
Kelompok midpoint adalah nilai tengah kelompok, kelas atau interval
Frekuensi relatif adalah prosentase dari total observasi dalam setiap kelompok jumlah frekuensi relatif = 1
Distribusi Frekuensi
Waktu operasi perakitan kendaraan bermotor
Contoh frekuensi relatif: 30/184 = 0.163
Jumlah frekuensi relatif = 1
x Waktu operasi (menit) f(x) Frekuensi (jumlah produk) f(x)/n Frekuensi relatif 0 to less than 100 100 to lesss than 200
200 to less than 300 300 to less than 400 400 to less than 500 500 to lesssthan 600
30
38
50
31
22
13 184 0.163 0.207 0.272 0.168 0.120 0.070 1.000 Distribusi Frekuensi Kumulatif x f(x) f(x)/n
Waktu operasi Frekuensi (jumlah Frekuensi
(menit) produk) relatif
0 to less than 100 30 0.163 100 to less than 20068 0.370 200 to less than 300 118 0.641 300 to less than 400 149 0.810 400 to less than 500 171 0.929
500 to lesssthan 600 184 1.000 Frekuensi kumulatif dari setiap kelompok adalah Frekuensi kumulatif dari setiap kelompok adalah jumlah frekuensi dari kelompok sebelumnya . jumlah frekuensi dari kelompok sebelumnya .
Distribusi frekuensi Tahapan penyusunan:
Menghitung jumlah kelas interval (k), dengan rumus
(Sturges) : k = 1 + 3,3 Log n dimana : k = Jumlah kelas interval n = Jumlah data Menghitung Rentang Data (R) R = Nilai data maksimum – Nilai data minimum
Menghitung Panjang Kelas Interval (p), dengan rumus :
p = R/k
Tabel Distribusi Frekuensi : Interva l Kelas (Limit) Batas Kelas (Boundaries ) Mid Point (x i ) Frek. (f i ) Frek. Kumulatif (f kum ) f i .x i (x i ) 2 f i (x i ) 2 Jumlah
Ukuran Statistik Ukuran Pemusatan
1. Rata-rata (Mean)
2. Nilai Tengah (Median)
3. Modus
Ukuran Penyebaran
1. Jangkauan (Range)
2. Variasi (Variance)
3. Simpangan Baku (Standard deviation)
Ukuran Letak
1. Kuartil
2. Desil
3. Persentil
Ukuran Lain
1. Skewness
2. Kurtosis
- – Rata-rata
Ukuran Pemusatan
Untuk data tunggal n dimana : x = Nilai dari data i n = Jumlah data atau
x i
banyaknya data didalam i 1
x i 1 , 3 2 , ,..., n
sample
n
Untuk data berkelompok (data yang disusun dalam daftar distribusi frekuensi) :
f x i i
dimana :
x f i
f = Frekuensi untuk kelas interval ke-i i atau
x = Nilai tengah i
f c i i
x = Nilai tengah yang akan diberi coding
x x p
f i
c = Variabel coding untuk kelas interval ke-i i
p = Panjang kelas interval
- – Median
Ukuran Pemusatan
Untuk data tunggal dimana: x i = Nilai tengah dari data n = Jumlah data atau banyaknya data didalam sample
Untuk data berkelompok (data yang disusun dalam daftar distribusi frekuensi) : dimana : Li = Batas bawah kelas median, yaitu kelas dimana median akan terletak. p = Panjang kelas interval n = Jumlah data F = Frekuensi kumulatif sebelum kelas median f = Frekuensi kelas berisi median
genap n bila
2 ganjil n bila ~ 1 ) ( 2 / 2 / ) 2 / 1 ( n n n x x x x p f
F n L Me Median i
2
- – Modus
Ukuran Pemusatan
Untuk data berkelompok (data yang disusun dalam daftar distribusi frekuensi) : b
1 Mo L p i b b 1 2 dimana : Li = Batas bawah kelas modus, yaitu kelas interval dengan frekuensi terbanyak p = Panjang kelas interval b = Selisih frekuensi kelas modus dengan frekuensi 1 kelas sebelumnya b = Selisih frekuensi kelas modus dengan frekuensi 2 kelas sesudahnya
– Kuartil
Ukuran Letak
ukuran letak yang membagi suatu distribusi menjadi 4 bagian yang sama, sesudah disusun menurut urutan nilainya.
Untuk data tunggal:
i n
1
LetakK datake dengan i 1 , 2 ,
3 i
4
Untuk data berkelompok (data yang disusun dalam daftar distribusi frekuensi) :
in
F
4 K L p dengan i
1 ,
2 ,3 i i f
dimana : Li = Batas bawah kelas Ki, yaitu kelas interval dimana Ki akan terletak n = Jumlah data p = Panjang kelas interval F = Frekuensi kumulatif sebelum kelas Ki f = Frekuensi kelas Ki
- – Desil
Ukuran Letak
ukuran letak yang membagi suatu distribusi menjadi 10 bagian yang sama besarnya.
Untuk data tunggal:
i n
1
LetakD datake dengan i 1 , 2 ,...,
9 i
10
Untuk data berkelompok (data yang disusun dalam daftar distribusi frekuensi) : in 10 F 1 2 9 D L p dengan i , ,..., i i f dimana : Li = Batas bawah kelas Di, yaitu kelas interval dimana Di akan terletak n = Jumlah data p = Panjang kelas interval F = Frekuensi kumulatif sebelum kelas Di f = Frekuensi kelas Di
- – Persentil
Ukuran Letak
ukuran letak yang membagi suatu distribusi menjadi 100 bagian yang sama.
Untuk data tunggal:
i n
1
LetakP datake dengan i 1 , 2 ,...,
9
9 i 100
Untuk data berkelompok (data yang disusun dalam daftar
in
F 100
distribusi frekuensi) :
P L p dengan i 1 , 2 ,...,
9
9 i i f
dimana : Li = Batas bawah kelas Pi, yaitu kelas interval dimana Pi akan terletak n = Jumlah data p = Panjang kelas interval F = Frekuensi kumulatif sebelum kelas Pi
Ukuran Penyebaran – Variansi & Simpangan Baku
- Untuk data tunggal:
- Untuk data berkelompok (data yang disusun dalam daftar distribusi frekuensi) :
1
1 2 1 1 2 1 2 2
n n x x n x x s n i i n i i n i i
1
1
2
1 1 2 1 2 2 2
n n x f x f n x x f s n i i i n i i i n i i i
Dimana: xi = Nilai tengah f = Frekuensi yang sesuai dengan nilai tengah n = Jumlah frekuensi
2 s s
Sehingga Standar Deviasi (Simpangan Baku) adalah :
Ukuran Lain Skewness Ukuran kesimetrisan distribusi data
Kemiringan atau kecenderungan distribusi data Kurva Simetris Kurva Miring ke Kiri Kurva Miring ke Kanan (0) (-) (+)
Kurtosis Ukuran kedataran atau keruncingan distribusi data (A) Leptokurtik (B) Platikurtik (C) Mesokurtik
Sampling & distribusi sampling
Teknik Penarikan Sampel
Proses mendapatkan sampel dari populasi
(Sampling)
mencerminkan populasi kesimpulan dari sampel= kesimpulan dari populasi Masalah dalam bagaimana proses pengambilan sampel Satuan sampling: segala sesuatu yang dijadikan satuan (unit) yang nantinya akan menjadi objek penelitian.
Daftar yang berisi satuan-satuan sampling yang ada dalam sebuah populasi, yang berfungsi sebagai dasar untuk penarikan sample.
Metode Penarikan Sample 1.Berdasarkan proses pemilihannya
a. Sampling with replacements
b. Sampling without replacements 2. Berdasarkan peluang pemilihannya.
a. Probability sampling
b. Non-probability sampling
Non-Probability Sampling
1. Convenience/accidental sampling: sample diambil secara spontanitas mudah dan murah
2. Judgement/purposive sampling: sample diambil berdasarkan karakteristik yang ditentukan oleh tujuan penelitian
3. Quota sampling: = (2), kuota (jatah) dan jumlah sample tertentu mirip stratifed tapi tidak acak
4. Snow ball sampling: =(2), populasi kecil dan spesifk teknik berantai (sample berikut ditentukan sample sebelumnya) biaya relatif kecil tapi bias/penyimpangan besar.
Probability Sampling
Random sampling: sampel Random sampling : sampel
(n ) diambil secara random i
(n ) diambil secara random i dari populasi (N ). i dari populasi (N ). i
Systematic sampling: sampel Systematic sampling : sampel diambil secara random untuk
diambil secara random untuk
pertama kali, dan selanjutnya
pertama kali, dan selanjutnya diambil secara sistematis. diambil secara sistematis.
Random dari 5 titik sampel pertama
Sistematis setiap 5 titik sampel Stratified sampling: sampel random (n i ) dipilih dari setiap kelompok populasi (N i ).
Stratified sampling: sampel
random (n i ) dipilih dari setiap kelompok populasi (N i ). 7 6 5 4 3 2 1 Group Population Distribution Sample Distribution
Cluster sampling: observasi dilakukan pada m cluster dari M cluster populasi.
Cluster sampling : observasi
dilakukan pada m cluster dari M cluster populasi. Prosedur Sampling 1.
Menentukan populasi target
2. Menentukan area populasi
3. Menentukan ukuran populasi 4.
Membuat kerangka sampling
5. Menentukan ukuran sample
6. Menentukan teknik dan rencana pengambilan
sample
7. Melakukan pengambilan sample
Distribusi Sampling
Distribusi sampling : distribusi peluang suatu statistik tergantung ukuran populasi, ukuran sample dan metode penarikan sample
Distribusi peluang disebut distribusi sampling
X dari rataan
1. Distribusi sampling dari rataan
2. Distribusi Chi Square
3. Distribusi Student-t
4. Distribusi F
Estimasi Parameter Pendahuluan
- x = 550
- Sebuah nilai estimasi yang memberikan sedikit informasi tentang rata-rata populasi.
- Peneliti 99% yakin bahwa ada dalam
interval [449,551]
Sebuah estimasi interval yang sempit
dengan tingkat keyakinan yang besar.
- Peneliti 90% yakin bahwa μ ada dalam interval[400,700]
Sebuah estimasi interval yang sempit
dengan tingkat keyakinan yang kecil.
Estimasi nilai tunggal dari distribusi sampling
Memberikan informasi tentang parameter populasi.Estimasi interval
Sebuah interval atau rentang yang diyakini mencakup nilai parameter populasi yang tidak diketahui. confience
Mengukur tingkat keyakinan ( ) bahwa interval tersebut sesungguhnya mengandung nilai parameter yang dicari. Estimator yang baik
Unbiased
Efsien
Konsisten
(Sufsien)
Unbiased
Sebuah estimator dikatakan unbiased jika nilai ekspektasinya sama dengan nilai parameter populasi.
Jika E(X)= maka rata-rata sampel adalah estimator unbiased untuk rata-rata populasi. Rata-rata dari sebuah sampel mungkin tidak sama dengan rata-rata populasi, tetapi jika dilakukan pengulangan sampel secara independen akan diperoleh nilai yang sama dengan parameter populasi.
Setiap penyimpangan (deviation) oleh estimator dari parameter populasi disebut bias.
Unbiased Misalkan, dari sekumpulan variabel random
1
X adalah estimator tidak bias (unbiased) dari
X E Dalam hal ini
X E
X E n
n i n i
1
) ( / ) (
X ~
, maka ekspektasi dari nilai rata-rata data adalah :
1
2
X X X , , ,
2 f diambil data-data n
) , (
. Estimator unbiased ada tepat pada target Estimator biased tidak berada tepat pada target.
{ Bias
Estimator Bias & Unbiased
Efsien
Sebuah estimator dikatakan efisien jika memiliki variansi yang relatif kecil.
Estimator efisien berada pada Estimator tidak efisien mungkin pada target dengan sebaran yang target dengan sebaran yang besar. kecil. Konsisten
Sebuah estimator dikatakan konsisten jika kemungkinan untuk mendekati parameter populasi semakin besar seiring dengan meningkatnya ukuran sampel.
Consistency n = 100 n = 10
Sufsien
Sebuah estimator dikatakan sufisien jika mencakup semua informasi tentang parameter populasi dalam data sampelnya. Estimasi Titik Ada tiga metoda estimasi titik (point estimation):
Metoda Unbiased
Metoda Momen
Metoda Maximum Likelihood Estimasi Interval
Estimasi interval adalah rentang yang diyakini
akan mencakup nilai parameter populasi yang tidak diketahui. Rentang ini juga memberikan besarnya keyakinan bahwa rentang tersebut mencakup nilai parameter yang diamati. Estimasi interval memiliki 2 komponen, yaitu:
Sebuah rentang nilai
Terkait dengan tingkat keyakinan ( level of
confdence ) Estimasi Interval
Sebuah estimator akan berada pada suatu rentang atau interval
tertentu jika diterapkan tingkat kepercayaan tertentu. Jika L dan
U adalah batas-batas interval dimana estimator akan berada
1 dengan tingkat kepercayaan , maka dapat didefnisikan :
P ( L U )
1 , untuk estimasi dua sisi atau
P (L )
1 , untuk estimasi satu sisi
L dimana =k dikenal sebagai akurasi (ketelitian) estimasi.
ˆ
Secara umum, distribusi memungkinkan menghitung k
sehingga diperolehˆ ˆ P ( k k ) 1 ,
1
. Estimasi Interval Interval yang dihitung dari suatu sampel tertentu disebut interval keyakinan (1-)100%. (1-) disebut
ˆ
k koefsien keyakinan, dan titik batas pada dan
ˆ
k
disebut batas-batas keyakinan.
Estimasi Interval
Rata-rata dengan variansi diketahui/tidak
Selisih rata-rata dengan variansi sama/tidak dan diketahui/tidak
Variansi tungal dan rasio
Proporsi
Contoh Rumus:
Untuk sampel besar ( n > 30) Untuk populasinya tidak terbatas atau terbatas yang pengambilan sampel dengan pengembalian dan diketahui, interval kepercayaan (1- )100% untuk adalah :
X Z
X Z / 2 / 2 n n
N n N n
Untuk populasinya terbatas tanpa pengembalian dan
X Z
X Z
/ 2 / 2 diketahui, interval kepercayaan (1- )100% untuk
N
1 N
1
n n
adalah
Contoh Pembacan Tabel Luas di bawah kurva normal
1- = 95%
=5%
/2 = 2.5% (uji dua arah) X = 1-0.025 = 0.975 Z =…… Z = 1,96
z 0.0 ... 0.06 ...
0.0
9
1.9 0.9750
Contoh Interpolasi Data: z 0.00 ...
0.05
0.06
1- = 96%
=4% (uji satu arah) 1.7 0.9599 0.960
X = 0.9600
8 Z = 1.75 X = 0.9599 1 1 Z = …… X = 0.9600 Z Z
X X
1 1
Z = 1.76 X = 0.9608
Z Z
X X 2 3 2 1 2 1
Z 1 .
75 . 9600 . 9599
1 . 76 1 . 75 . 9608 . 9599
Z 1 .
75 . 0001
. 01 . 0009 . 0009 Z . 001575 . 000001
. 0009 Z . 001576
Z
1 . 751
Contoh :
Perusahaan XYZ memiliki karyawan 250 orang.
Untuk keperluan tertentu, ingin diketahui rata-rata jam kerjanya per minggu. Untuk itu, diambil sampel sebanyak 35 orang dan diperoleh data bahwa rata-rata jam kerja karyawan tersebut adalah 39,76 jam per minggu. Jika simpangan baku rata-rata jam kerjanya 0,93 jam estimasilah dengan tingkat keyakinan 90%, rata-rata jam kerja karyawan tersebut! Penyelesaian :
1 ( 76 , 39
35 250
1
1 2 / 2 /
N N n n Z
X N N n n Z
X
35 93 , ) 65 ,
1 ( 76 , 39 1 250
N = 250
1- = 90%
n = 35
X = 39,76
= 0,93
35 93 , ) 65 ,
= 10%
Z /2 = Z 0.05 = 1,65 Kesimpulan: Jadi rata-rata jam kerja karyawan perusahaan XYZ dengan tingkat keyakinan 90% berada antara 39,53 jam sampai
39,99 jam perminggu.
99 ,
39 53 ,
39 1 250 35 250
Uji Hipotesis
Pengertian Hipotesis Statistik
Hipotesis (Hypothesis) Greece Hupo= Sementara, dan Thesis= Pernyataan/Dugaan Jenis Hipotesis:
1. Hipotesis Penelitian (Research Hypothesis) Proporsional (Verbal) Tidak bisa diuji secara empiris
2. Hipotesis Statistik (Statistical Hyphothesis) Berdasarkan data Dapat diuji secara empiris
Suatu asumsi mengenai parameter fungsi frekuensi peubah acak Hipotesis Penelitian Hipotesis Statistik Dugaan Pengertian Hipotesis Statistik
Hipotesis Penelitian Hipotesis Statistik Dugaan penelitian dalam H dan H 1 H merupakan hipotesis nol (null hypothesis) dan merupakan hipotesis yang akan diuji dan yang nantinya akan diterima atau ditolak tergantung pada hasil eksperimen atau pemilihan sampelnya.
H merupakan hipotesis alternative atau hipotesa 1
tandingan (alternative hypothesis) Pengujian Hipotesis
b . H : H :
x 1 x
a . H : H :
x 1 x Jika H Benar
Jika H Benar Daerah Penolakan Daerah Penerimaan
Daerah Penerimaan (1-α
) (1-α )
Titik kritis Titik kritis Pengujian Hipotesis
: : 1 x x H H
Daerah Penerimaan (1-α )
2
2
Daerah Penolakan bagi μyang terlalu kecil Daerah Penolakan bagi μyang terlalu besar
Jika H Benar
Kesalahan pada Pengujian Hipotesis
HIPOTESIS Keputusan
Pengujian Jika H Benar Jika H palsu (H Benar) 1 Keputusan yang benar. Kesalahan jenis II.
Terima H Probabilitas = 1 - α Probabilitas = β
“Tingkat Keyakinan” Kesalahan jenis I. Keputusan yang benar.
Tolak H Probabilitas = α Probabilitas =1 - β
“Taraf Nyata” “Kuasa Pengujian”
α= Level of Signifnace
1 – α= Level of Confdence 1 – β= Power of the Test Tahapan Pengujian Hipotesis
1. Nyatakan hipotesis ststistik (H0 dan H1) yang sesuai dengan hipotesis penelitian yang diajukan.
2. Menentukan taraf nyata/ alpha (Level of signifcance) 3. Menentukan jumlah sampel.
4. Mengumpulkan data melalui sampel probabilitas
(probability sample/random sample)
5. Gunakan statistik uji yang tepat (distribusi z, t, …)
6. Menentukan titik kritis dan daerah kritis (daerah
penolakan) H0
7. Menghitung nilai statistik uji berdasarkan data yang
dikumpulkan. Perhatikan apakah nilai hitung statistik uji jatuh di daerah penerimaan atau penolakan.
8. Berikan kesimpulan statistik (statistical conclusion)
Contoh soal :
Suatu perusahaan pembuat pesawat terbang komersial menyatakan, bahwa hasil produksinya setelah dipergunakan dalam waktu 1 tahun diperlukan pengecheckan kembali selama 11 jam dengan standar deviasi 3,5 jam. Setelah berselang 3 tahun teknisi pesawat meragukan hipotesis ini, sehingga perlu dilakukan pengamatan kembali dengan mengambil sampel sebanyak 49 buah pesawat, ternyata waktu rata-rata yang diperlukan untuk mengadakan pemeliharaan ini 12 jam. Teknisi masih percaya bahwa standar deviasinya tetap tidak berubah. Apakah ada alasan untuk meragukan bahwa waktu yang diperlukan untuk pemeliharaan pesawat terbang dalam 1 tahun diperlukan 11 jam, apabila dipergunakan taraf keberartian 10% ?
- Formulasi hipotesis :
- Kriteria pengujian
- Statistik uji, distribusi Z :
- Taraf keberartian (level of signifcance) = 10%, dari tabel kurva normal diperoleh nilai Z /2
= 1.645.
Digunakan pengujian dua sisi (two-tailed)
H o : = 11 jam H 1 : 11 jam
Penyelesaian:
. / . / n x z
11
12
3
5
49
1
5
2
Ho diterima jika : -1.645 Z 1.645 H1 ditolak jika : Z > 1.645 dan Z < -1.645 Kesimpulan :
- Karena nilai Z lebih besar dari nilai Z hitung tabel (+2 > +1.645) maka Ho ditolak pada level signifcance 10%, dan dapat dinyatakan bahwa rata-rata pemeliharaan pesawat terbang tersebut lebih dari 11 jam. Agar lebih jelas dapat dilihat dalam gambar dibawah ini Penolakan Daerah Daerah +2 Penolakan Daerah penerimaan
- -1.645 +1.645