Dani Leonidas S ,ST.MT
Statistik Bisnis 10 – Populasi dan Sampel Dani Leonidas S ,ST.MT Pendahuluan
Populasi
Sensus
Sampel
Statistik Deskriptif
Statistik Induktif (inferensial) Mengapa Sampling ??
Teknik sampling berguna untuk
Mereduksi anggota populasi menjadi anggota sampel yang mewakili populasinya
Lebih teliti menghitung yang sedikit daripada yang banyak
Menghemat waktu, biaya, benda uji yang dirusak
Mengambil sampel dengan harapan dapat menarik kesimpulan mengenai populasi
Ada dua cara yang digunakan untuk mengetahui parameter populasi:
1. Cara penaksiran (pendugaan)
2. Cara pengujian hipotesis
Penyampelan acak
Penyampelan terstrata
Penyampelan klaster
Penyampelan sistematis Teori Estimasi atau Menaksir Pendahuluan
Diperkirakan setiap harinya toko A dapat
menjual antara 30 sampai 60 unit barang X.
Dari total barang yang dikirim, kira-kira ada 10 % barang yang dikirimkan tidak sampai kepada alamat yang dituju
Jumlah gol yang tercipta pada final piala champio eropa nanti diperkirakan antara 0 sampai 3
Pada hari kerja diantara hari libur, diperkirakan
40 % karyawan tidak masuk (mengambil cuti)Pendahuluan
Apakah sebenarnya yang akan ditaksir menurut statistika??
Segala sifat atau karakteristik yang menjelaskan tentang populasi
Menaksir parameter populasi didasarkan pada nilai-nilai statistik sampel yang
diambil dari populasi bersangkutan.
Menaksir rata-rata populasi µ (myu) dan
Teori Penaksiran
Ada dua cara yang digunakan untuk mengetahui parameter populasi:
1. Cara penaksiran (pendugaan)
2. Cara pengujian hipotesis
Dua cara di atas didasarkan pada statistik atau besaran yang dihitung dari sampel sehingga kita harus mengambil sampel dari populasi
Penaksiran adalah menyimpulkan parameter
populasi (t) berdasarkan statistik sampel θ
(Theta).
Θ bisa merupakan rata-rata µ, simpangan baku σ, proporsi p dan sebagainya
Penaksir yang baik ialah penaksir yang tak bias dan bervarians minimum.
Tak bias penaksir θ dikatakan tak bias jika rata- → rata harga θ yang mungkin sama dengan θ.
Bervarians minimum penaksir dengan varians → terkecil diantara semua penaksir yang mungkin
Kriteria taksiran (pendugaan) yang baik
1.Tidak bias (Unbiasedness),
Artinya statistik sampel yang digunakan sebagai penduga
harus sama atau mendekati parameter populasi penduga2. Efisiensi (Efficiency), Artinya statistik sampel memiliki deviasi standar yang kecil
3. Konsistensi (Consistency), Artinya jika ukuran sampel meningkat maka statistik sampel akan semakin mendekati parameter populasinya.
4. Kecukupan (Sufficiency),
Artinya suatu taksiran dikatakan memiliki kecukupan jika
taksiran tersebut dapat memberikan informasi yang cukup mengenai sifat populasinya.Cara Menaksir
Penaksiran titik, jika parameter ditaksir oleh 1 angka tunggal.
Misal : µ ditaksir oleh X, X adalah penaksir titik.
Penaksiran interval, jika parameter ditaksir oleh harga diantara batas- batas dua harga.
Misal: rata-rata tinggi mahasiswa antara Koefisien Kepercayaan
Kita juga dapat menduga bahwa tinggi rata-rata orang Indonesia berada dalam selang 155 sampai 169 cm.
Makin lebar intervalnya, makin besar kepercayaan atau keyakinan bahwa rata-rata tinggi orang Indonesia yang kita duga berada pada interval tersebut.
Artinya, kita lebih percaya selang 155 < θ < 169 dibandingkan dengan selang 160 <θ < 166.
Derajat kepercayaan penaksir disebut koefisien kepercayaan yang ditulis dengan α dimana 0 < α < Koefisien Kepercayaan
Contoh, misalkan P(160 < θ < 166) =
0.95 , itu artinya derajat keyakinan bahwa rata-rata tinggi orang Indonesia berada pada selang 160 sampai 166 adalah 95% Misalkan P(155 < θ < 159) = 0.99, itu
artinya derajat keyakinan bahwa rata-
rata tinggi orang Indonesia berada pada selang 155 sampai 159 adalah 99%Selang Kepercayaan
Secara umum, dengan mengambil sampel acak secara berulang-ulang, maka kita akan mendapatkan statistik θ sehingga peluang dari interval
a < θ < b akan sama dengan nilai tertentu yang diinginkan adalah
P(a < θ < b ) = 1- α untuk 0 < α < 1 α disebut koefisien kepercayaan
1- α disebut tingkat atau derajat kepercayaan
Selang a < θ < b disebut selang kepercayaan (1- α)100% a dan b disebut batas-batas kepercayaan
Jadi bila α = 0.05 diperoleh selang kepercayaan 95%, bila α = 0.01
diperoleh selang kepercayaan 99% Makin besar selang kepercayaan, makin yakin kita bahwa selang tersebut mengandung parameter yang tidak diketahui
Dalam statistik, lebih disukai memilih interval yang lebih sempit, tetapi dengan derajat kepercayaan yang tinggi. Misalnya kita lebih memilih selang 160 < θ < 166 dengan tingkat kepercayaan 95% daripada
Jadi bila α = 0.05 diperoleh selang kepercayaan 95%,
bila α = 0.01 diperoleh selang kepercayaan 99% Makin besar selang kepercayaan, makin yakin kita
bahwa selang tersebut mengandung parameter yang
tidak diketahui Dalam statistik, lebih disukai memilih interval yang lebih sempit, tetapi dengan derajat kepercayaan yang tinggi.
Misalnya kita lebih memilih selang 160 < θ < 166 dengan tingkat kepercayaan 95% daripada selang 155 < θ < 169 dengan tingkat kepercayaan 99% Intepretasi Selang Kepercayaan
Selang kepercayaan 95 % artinya rata-rata
hitung sampel untuk ukuran sampel yang ditentukan akan terletak di dalam 1,96 standar deviasi dari rata-rata hitung populasi yang dihipotesakan Selang kepercayaan 99 % artinya rata-rata hitung sampel untuk ukuran sampel yang ditentukan akan terletak di dalam 2,58 standar deviasi dari rata-rata hitung populasi yang dihipotesakan
Menaksir rata-rata
Keterangan Keterangan Populasi Populasi Sampel Sampel
Nilai rata-rata Nilai rata-rata µ µ Nilai variansi Nilai variansi σ σ S S Nilai Proporsi Nilai Proporsi
�
2 ∑
´ �=
� − ´ � ( )
�
2 ∑
� =
� �−1 √ h ����� ������ �����������
´
�= h ����� ������������
Menaksir rata-rata µ
Misal ada populasi N (µ, σ), akan ditaksir µ.
Untuk itu diambil sampel berukuran n dan di hitung dan S
maka taksiran untuk µ adalah
Simpangan baku σ diketahui dan populasi tidak Terhingga
2
2
1 X
X p X Z
X Z n n
Contoh
Sebuah biro pariwisata di Jakarta mengadakan suatu penelitian tentang kepariwisataan di Indonesia dan ingin memperkirakan pengeluaran rata-rata wisatawan asing per kunjungannya di Indonesia.
Guna keperluan di atas, suatu sampel random yang terdiri dari 100 wisatawan asing telah dipilih guna diwawancarai dari populasi yang dianggap tidak terhingga.
Hasil wawancara tersebut memberikan keterangan: rata-rata
pengeluaran per kunjungan sebesar US$ 800 per wisatawan.
Jika kita anggap deviasi standar dari pengeluaran semua wisatawan kurang lebih konstan sebesar US$ 120, maka buatlah interval keyakinan sebesar 95%.
Diketahui
n = 100
1 – α = 0.95
Maka didapat dari.....
1 – α = 0.95
α = 1 – 0.95 = 0.05
α/2 = 0.025
Cari Z dengan luas wilayah di bawah kurva normalnya = 1 – 0.025 = 0.9750
Maka didapat nilai Z nya 1.96 Tabel Normal Lengkap
Interval...
X X p X Z
X Z
1
2
2
n n
120 120
p 800 1, 96 800 1, 96 0, 95
100
100 p 776, 48 823, 53 0, 95
Kesimpulan
Rata-rata pengeluaran wisatawan per kunjungan akan berkisar
sekitar US$ 776.48 hingga US$
823.52.
Jika dipakai interval keyakinan
90% ?? 1 – α = 0.90
α = 1 – 0.90 = 0.1
α/2 = 0.05
Cari Z dengan luas wilayah di bawah kurva normalnya = 1 – 0.05 = 0.950
Maka didapat nilai Z nya 1.645 Tabel Normal Lengkap
Jika dipakai interval keyakinan
99% 1 – α = 0.99
α = 1 – 0.99 = 0.01
α/2 = 0.005
Cari Z dengan luas wilayah di bawah kurva normalnya = 1 – 0.005 = 0.995
Maka didapat nilai Z nya 2,575 Tabel Normal Lengkap
Simpangan baku σ diketahui dan populasi terhingga
2
2
1
1
1 X
X N n N n p X Z
X Z N N n n
Faktor koreksi
1
1
1
2
N n n Z
X N N n n Z
X p
X X Contoh populasi Terhingga
Andaikan sampel random sebesar n =
64 dan rata-rata sebesar 0,1165 dipilih dari populasi terbatas sebesar N = 300 dan yang diketahui memiliki simpangan baku populasi 0,0120, maka pendugaanparameter rata-rata populasi dengan
interval keyakinan sebesar 95,45% dapat dilakukan sebagai berikut:
Diketahui
1- α = 95.45 %
n = 64
N n N n
X X p X Z
X Z
1
2
2
N
1
n n
0, 012 300 64 0,012 300 64
p 0,1165 2 0,1165 2 9545
300 1
300 1
64 64
p 0,11382 0,11918 0,9545
Pendugaan Interval ( untuk populasi tidak
terhingga dan Simpangan Baku tidak diketahui)
1
2
2 n s
Z
X n s Z
X p Contoh
Sebuah sampel random yang terdiri dari 100
mahasiswa telah dipilih dari populasi mahasiswa sebuah universitas. Keseratusmahasiswa di atas telah diberi semacam tes
kesehatan guna menentukan angka kuosien
kecerdasannya. Angka rata-rata keseratus mahasiswa di atas ternyata sebesar 112 dengan deviasi standar 11. berilah interval keyakinan 95% guna menduga angka rata-rata kuosien kecerdasan seluruh mahasiswa
Diketahui
S
n = 100
s s
p
X Z
X Z
1
2
2
n n
11
11
p 112 1,96 112 1,96 0,95
100 100
p 109,844 114,156 0,95
Angka rata-rata kecerdasan
seluruh mahasiswa akan terletak
antara 109,844 hingga 114,156Menaksir jika Sampel Berukuran Kecil (n < 30)
1
2
2 n s t
X n s t
X p
Di suatu pabrik tekstil telah diukur 16 buah kayu untuk dasar penaksiran panjang rata-rata tiap kayu yang dihasilkan. Dari 16 kayu yang diukur tadi, ternyata rata-rata panjangnya 54,4 m sedangkan simpangan bakunya 0,8 m. tentukan interval kepercayaan panjang rata-rata sebenarnya untuk tiap kayu yang dihasilkan dengan tingkat kepercayaan 95%.
Df (degree of freedom) = n – 1 = 15
9 ,
54 1 ,
54 95 ,
16 8 , 1315 ,
2 5 ,
54
16 8 , 1315 ,
2 5 ,
54
p Menaksir Proporsi
Keterangan Keterangan Populasi Populasi Sampel Sampel
Nilai rata-rata Nilai rata-rata µ µ Nilai variansi Nilai variansi σ σ S S Nilai Proporsi Nilai Proporsi
2 � − ´ �
( ) �
2 ∑
� ∑
= ´
� �= �
�−1 √ h ����� ������ �����������
´
�= h ����� ������������ Pendugaan Proporsi dengan sampel
besar dengan populasi tidak terhingga
1
1
1 2 2 n n x n x Z n x
P n n x n x
Z n x p Contoh
Jawatan kesehatan kota ingin sekali meneliti
presentasi penduduk kota dewasa yangmerokok paling tidak satu bungkus per hari.
Sebuah sampel random sebesar n = 300 telah dipilih dari populasi yang terdiri dari penduduk kota yang telah dewasa dan ternyata 36 orang merokok paling sedikit satu bungkus per hari.Buatlah interval keyakinan sebesar 95% guna menduga proporsi penduduk kota dewasa yang
merokok paling sedikit satu bungkus per hari.
Diketahui
X = 36
n = 300
x x x x
1
1
x x n n n n
p Z P Z
1
2
2
n n n n
36 264
36 264
1 1
36 300 300 36 300 300
p 1,96 P 1,96 0,95
300 300 300 300
p 0, 083 P 0,157 0,95
Proporsi penduduk dewasa yang merokok setidaknya satu bungkus per hari akan terletak antara 8,3% hingga 15,7%. Menaksir Variansi
Keterangan Keterangan Populasi Populasi Sampel Sampel
Nilai rata-rata Nilai rata-rata µ µ Nilai variansi Nilai variansi σ σ S S Nilai Proporsi Nilai Proporsi
2 � − ´ �
( ) �
2 ∑
� ∑
= ´
� �= �
�−1 √ h ����� ������ �����������
´
�= h ����� ������������
Menaksir Variansi
Menaksir Variansi
Berat 10 paket biji rumput yang didistribusikan oleh perusahaan tertentu adalah 46.4; 46.1; 45.8; 47.0; 46.1; 45.9; 45.8; 46.9; 45.2;
95% dari variansinya, asumsi distribusi normal.
1 – α = 0,95
α = 1 – 0,95 = 0,05
α/2 = 0,025
1- (α/2) = 0,975
ν = n – 1 = 10 – 1 = 9
2
s = 0,286
Menaksir Variansi
Menaksir Selisih Rata-rata
Misalkan terdapat dua populasi, keduanya berdistribusi normal.
Rata-rata dan simpangan bakunya masing masing µ ,σ , dan µ , σ
1
1
2
2
Jumlah Sampel dari masing-masing populasi n dan n
1
2
- -
2
X X n n Z
1 n n Z
2
1
2
1
2
1
2
1
2
1
2
1
1 .
Pendugaan Parameter
1
1 .
1
1
2 dan σ diketahui
1 =
2 dengan
1
X X p
- -
2
1
1
1 .
1
1 .
1
2
1
2
1
2
1
2
1
n n
s tX X
n n
s t
- (
- 2
- �
2
� )
) �
Pendugaan Parameter
1
2 dengan
1 =
2 namun besar σ tidak diketahui �
2 =
( �
1 −1
1
�= ( 1+
2
�
2 −1
) �
2
2 �
1
2 −2
X X p p p
- -
2
1
2
1
2
1
2
2
1
1
2
1
2
1
2
1
n n
ZX X
n n
Z2
2
Pendugaan Parameter
1
2 dengan
1 ≠
2, besar
1 dan
2
diketahui
1
1
2
2
2
X X p
Seorang importir menerima kiriman 2 macam
lampu pijar bermerk A dan B dalam jumlah yang
besar sekali. Secara random dipilih sampel masing-
masing 50 untuk diuji daya tahannya. Rata-rata
daya tahan A dan B adalah 1.282 jam dan 1.208
jam. Berdasarkan pengalaman deviasi standar
kedua merk adalah konstan sebesar 80 dan 94 jam.
Buatlah dugaan tentang beda rata-rata daya tahan
kedua macam lampu pijar dengan interval
Diketahui
= 1282
= 1208 n = 50
1
n = 50
2
50
95 , 107 95 , 05 ,
40
95
50
94
50
80 96 ,
1
74
50
94
80 96 ,
X X p
1
74
2
1
2
2
2
1
2
2
X X
n n
Z
1
1
2
2
2
1
2
1
2
2
1
n n
Z1
2
1
2
2
2
1
2
1
2
1
2
p p Menaksir Selisih Proporsi
Misalkan terdapat dua populasi, untuk peristiwa yang sama p1 dan p2.
Jumlah Sampel dari masing-masing populasi n dan n
1
2
- P
2
2
1
1
1
1
1
2
2
2
1
1
2
1
2
2
2
2
2
1
1
1
1
1
2
2
2
1
1 n n x n x n n x n x
Z n x n x
2
2
Pendugaan parameter P
1
2 dimana
diketahui
2
1
1
1
1
1
P P n n x n x n n x n x Z n x n x p
Terdapat 500 pemudi dan 700 pemuda yang
mengunjungi sebuah pameran. Yang menyenangi pameran tersebut adalah 325pemudi dan 400 pemuda. Tentukan interval
kepercayaan 95% untuk perbedaan pemuda
dan pemudi yang mengunjungi dan menyenangi pameran.
Diketahui
= 325
= 400
= 500
= 700
325 96 , 1 700
400 500 325
700 700 400
1 700 400 400
500
325
1 500325 96 , 1 700
400 500 325
2
1
1 700 400 400
500 325 1 500
700 700 400
P P n n x n x n n x n x Z n x n x p
1
1
1
1
1
2 2 2 2 2 1 1 1 1 1 2 2 2 1 1 2 1 2 2 2 2 2 1 1 1 1 1 2 2 2 1 1 n n x n x n n x n x
Z n x n x
P P
Menentukan Ukuran Sampel
Berapa banyak sampel yang diperlukan ??
Jumlah sampel yang diambil
dipengaruhi 3 faktor Derajat keyakinan/ interval kepercayaan yang diinginkan
Batas maksimum kesalahan yang dibolehkan
Variansi populasi
Jumlah Sampel Untuk Menduga Nilai rata-
rata apabila standar deviasi populasi diketahui E = batas maksimum kesalahan perkiraan nilai rata-rata
Jika diketahui
σ = 10
E = 2
1 – α = 0,95 atau α = 0,05
Ditanya jumlah sampel yang diperlukan
Jawab
= 96,04
=97
Jumlah Sampel Untuk Menduga Nilai
proporsi E = batas maksimum kesalahan perkiraan nilai rata-rata
Diketahui
P = 0,45
E =0,10
1-α = 0,99 atau α =0,01
Ditanyakan n
n = (0,45)(0,55)