Bahan Ajar Statistika

Bahan Ajar Statistika
Haryadi
Universitas Muhammadiyah Palangkaraya
2011

2

Daftar Isi
1 Populasi dan Sampel
1.1 Pengantar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Sifat variabel dalam penelitian . . . . . . . . . . . . . . . . . . . . .

5
5
8

2 Penyajian Data
11
2.1 Distribusi Frekuensi . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 Histogram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3 Diagram Batang dan Daun . . . . . . . . . . . . . . . . . . . . . . . 16

3 Ringkasan Data
3.1 Ukuran Kecenderungan
3.2 Varian . . . . . . . . .
3.3 Persentil . . . . . . . .
3.4 Box Plot . . . . . . . .
3.5 Teorema Chebyshev . .

Pusat
. . . .
. . . .
. . . .
. . . .

.
.
.
.
.

.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.

.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.


.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.

.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.

.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.


.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

19

19
23
25
26
27

4 Peluang
29
4.1 Ruang Sampel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.2 Peluang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.3 Peluang Bersyarat . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5 Variabel Random
5.1 Variabel Random Diskrit . . . .
5.2 Nilai Harapan Variabel Random
5.3 Variabel Random Kontinu . . .
5.4 Variabel Random Bersama . . .

. . . . .
Diskrit
. . . . .

. . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.

.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.

.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

37
37
41
43
43

6 Beberapa Distribusi Peluang
45
6.1 Distribusi binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3

4

DAFTAR ISI

6.2
6.3

Distribusi Normal . . . . . . . . . . . . . . . .
Distribusi yang berhubungan dengan distribusi
6.3.1 Distribusi Chi-Square . . . . . . . . . .
6.3.2 Distribusi t . . . . . . . . . . . . . . .
6.3.3 Distribusi F . . . . . . . . . . . . . . .

. . . . .
normal
. . . . .
. . . . .
. . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

7 Teori Sampling
8 Estimasi
8.1 Interval
8.2 Interval
8.3 Interval
8.4 Interval

Kepercayaan
Kepercayaan
Kepercayaan
Kepercayaan

46
51
51
51
52
53

untuk µ dengan σ Diketahui . . . .
untuk µ dengan σ Tidak Diketahui
untuk σ 2 . . . . . . . . . . . . . . .
Selisih Dua Mean . . . . . . . . . .

9 Uji Hipotesis
9.1 Uji tentang mean populasi normal . . . . . . . . . .
9.1.1 Uji hipotesis dengan σ 2 diketahui . . . . . .
9.1.2 Uji hipotesis dengan σ 2 tidak diketahui . . .
9.2 Uji kesamaan mean dua populasi . . . . . . . . . .
9.2.1 Varian populasi diketahui . . . . . . . . . .
9.2.2 Varian populasi tidak diketahui . . . . . . .
9.2.3 Varian tidak diketahui dan tidak sama . . .
9.3 Uji t berpasangan . . . . . . . . . . . . . . . . . . .
9.4 Uji hipotesi tentang varian populasi normal . . . .
9.5 Uji hipotesis kesamaan varian dua populasi normal
9.6 Uji Goodness of Fit . . . . . . . . . . . . . . . . . .
9.7 Uji Independen . . . . . . . . . . . . . . . . . . . .
10 Regresi Linear Sederhana
10.1 Sifat Estimator β̂ dan α̂ . . . . .
10.2 Inferensi tentang parameter β dan
10.3 Koefisien Determinasi . . . . . . .
10.4 Korelasi . . . . . . . . . . . . . .

. .
α
. .
. .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

57
58
60
61
62

.
.
.
.
.
.
.
.
.
.
.
.

65
66
66
69
71
71
72
74
75
76
77
78
80

.
.
.
.

83
86
87
88
89

Bab 1

Populasi dan Sampel
1.1

Pengantar

Banyak kesimpulan sehari-hari didasarkan pada informasi yang tidak lengkap. Kesimpulan semacam ini tentu mengandung ketidak pastian. Di dalam statistika,
kita akan mempelajari bagaimana menggali informasi atau membuat kesimpulan
berdasarkan informasi yang tidak lengkap.
Definisi 1.1.1. Statistika merupakan studi tentang bagaimana mengumpulkan,
mengorganisasi, menganalisis dan menginterpretasikan data.
Dengan demikian persyaratan untuk dapat melakukan studi dengan statistika
adalah adanya data. Data diperoleh dengan melakukan observasi dari karakter
individu-indvidu yang menjadi perhatian kita.
Sering terjadi data yang diperlukan dalam studi statistik sudah tersedia, misalnya data yang diterbitkan oleh Badan Pusat Statistik. Dapat pula terjadi data
yang diperlukan dalam studi belum tersedia. Dalam hal data belum terdesia maka
perlu diadakan dengan jalan melakukan observasi atau eksperimen.
Definisi 1.1.2. Variabel adalah karakteristik yang diukur atau diobservasi dari
suatu objek.
Variabel kuantitatif adalah variabel yang dinyatakan dalam bentuk bilangan
atau numerik.
Variabel kualitatif adalah variabel yang dinyatakan dalam kategori atau kelompok tertentu
5

6

BAB 1. POPULASI DAN SAMPEL

Jika kita ingin meneliti prestasi belajar siswa suatu kelas, maka variabelnya
dapat berupa nilai hasil belajar. Penelitian tentang tingkat kemasaman air di
Palangkaraya, variabelnya bisa berupa pH air. Suatu penelitian yang bertujuan
untuk mengetahui jenis warna yang disukai anak TK, variabelnya dapat berupa
warna.
Definisi 1.1.3. Populasi adalah kumpulan semua individu ( objek) yang menjadi
perhatian studi.
Bagian dari populasi dinamakan sampel.
Banyaknya anggota populasi dinamakan ukuran populasi.
Banyaknya anggota sampel dinamakan ukuran sampel.
Data yang diperoleh dari sampel dinamakan data sampel.
Contoh 1. Suatu studi bertujuan untuk mengetahui berat badan rata-rata mahasiswa UM Palangkaraya. Karena keterbatasan tenaga dan waktu, maka diambil
sampel 100 orang mahasiswa untuk timbang berat badannya. Dalam studi ini,
populasinya adalah seluruh mahasiswa UM Palangkaraya, sampelnya adalah ke 100
mahasiswa tersebut, dan variabelnya adalah berat badan yang merupakan variabel
kuantitatif. Jelas bahwa rata-rata berat badan yang diukur dari 100 mahasiswa
tidak menjamin akan mencerminkan rata-rata berat badan seluruh mahasiswa UM
Palangkaraya. Hal ini dikarenakan informasinya tidak lengkap. Dalam hal ini bisa
saja seluruh mahasiswa UM Palangkraya ditimbang berat badanya agar diperoleh
kesimpulan yang tepat, namun tentu diperlukan waktu dan biaya yang lebih besar
dibanding dengan mengamati 100 mahasiswa.
Dalam suatu studi umumnya kita menggunakan dapat sampel. Banyak alasan
mengapa kita mengunakan data sampel, diantaranya (i) keterbatasan sumberdaya
dan (ii) keterbatasan teknis.
Definisi 1.1.4. Parameter adalah suatu karekertistik populasi.
Statistik adalah suatu nilai yang dihitung dari data sampel.
Pada contoh 1, parameternya adalah rata-rata berat badan seluruh mahasiswa
UM Palangkaraya, yang dalam hal ini nilainya tidak diketahui; sedangkan statistiknya adalah rata-rata berat badan yang dihitung dari ke 100 mahasiswa tersebut.
Parameter umunya tidak diketahui nilainya. Oleh karena itu kita harus cukup
puas untuk menduga nilai parametr. Statistik digunakan untuk menduga (to estimasi) parameter. Suatu statistik dikatakan representatif (mewakili) jika dapat

1.1. PENGANTAR

7

menggambarkan keadaan parameter dengan baik.
Ada banyak kriteria mengenai statistik yang baik untuk suatu parameter. Baik
tidaknya suatu statistik sangat bergantung pada bagaimana sampel tersebut diambil dari populasi. Suatu proses pengambilan sampel dinamakan sampling.
Cara pengambilan sampel Ada beberapa cara pengambilan sampel:
• Random sampling
• Stratified sampling
• Sistematik sampling
• Cluster sampling
Sampel random berukuran n dari suatu populasi adalah bagian populasi yang
diambil dengan cara sedemikian sehingga:
1. setiap sampel berukuran n memiliki kesempatan yang sama untuk terpilih.
2. setiap anggota populasi memiliki kesempatan yang sama untuk terpilih.
Suatu prosedur untuk memperoleh sampel random adalah dengan menggunakan
bilangan random. Bilangan random dapat diperoleh pada tabel bilangan random,
kalkulator atau program komputer.
Prosedur melakukan random sampling:
1. Beri nomor semua anggota populasi secara berurutan
2. Gunakan tabel, kalkulator atau komputer untuk memilih bilangan random.
3. Buatlah sampel dengan menggunakan anggota populasi yang nomornya berkaitan dengan bilangan random yang terpilih.
Contoh 2. Akan diambil sampel random berukuran 10 dari sebuah kelas yang
memiliki 50 siswa. Langkah-langkahnya:
1. Beri nomor urut pada setiap anggota kelas mulai nomor 1 sampai dengan
nomor 50.
2. Gunakan tabel bilangan random, dengan cara: pertama tunjuk sebarang bilangan pada tabel, kemudian diteruskan dengan menuliskan bilangan random
berikutnya secukupnya. Misal dalam contoh ini diperoleh bilangan random

8

BAB 1. POPULASI DAN SAMPEL

mulai baris ke-7 dan kolom ke-9:
66
94730 95761 75023 48464 65544 96583 18911
16391 99938 90704 93621 66330 33393 95261
Karena banyaknya sampel merupakan bilangan dua digit, maka bilangan random di atas dikelompokan menjadi dua digit :
66
64
99
39

94
65
93
39

73
54
89
52

09
49
07
61

57
65
04

61
83
93

75
18
62

02
91
16

34
11
63

84
63
30

91
33

3. Daftar semua anggoka kelas yang nomornya sesuai dengan nomor pada bilangan random yang telah dikelompokan tersbut. Jika ditemui bilangan yang
lebih besar dari 50 maka diabaikan, dan jika diperoleh bilangan random yang
sudah terpilih sebelumnya, maka diabaikan. Anggota populasi yang terpilih
sebagai anggota sampel adalah yang bernomor:
09

02

34

49

18

11

07

04

16

30

33.

Stratified sampling Stratified sampling adalah cara pengambilan sampel
dari populasi yang memiliki strata tertentu. Misalnya, pada populasi mahasiswa
UM Palangkaraya, stratanya dapat berupa lulusan SMA, sudah bekerja dan mahasiswa pindahan. Pada teknik ini, populasi dibagi minimal dalam dua strata,
kemudian pada setiap strata pengambilan sampel dilakukan secara random sampling.
Sistematik sampling. Pada metode ini anggota populasi disusun dengan urutan tertentu. Kemudian dilakukan pengambilan satu individu secara random, dan
dilanjutkan dengan mengambil setiap anggota ke k dari sampel.
Cluster sampling . Pada metode ini, dimulai dengan membagi wilayah menjadi beberapa bagian (cluster). Kemudian diambil secara random bagian-bagian
tersebut. Setiap anggota cluster menjadi anggota sampel.

1.2

Sifat variabel dalam penelitian

Didalam studi observasi, pengukuran terhadap anggota sampel dilakukan sehingga tidak merubah respon atau variabel yang diteliti.

1.2. SIFAT VARIABEL DALAM PENELITIAN

9

Di dalam eksperimen, perlakuan diberikan pada individu untuk melihat perubahan respon atau variabel yang diukur.
Untuk memperoleh data, kadang-kadang peneliti harus mengambil data dari orangorang dengan cara memberikan pertanyaan. Proses ini dinamakan survey.
Pengkategorian lain dari data adalah berdasarkan tingkat pengukuran, dalam
arti berdasarkan sifat aritmetika data. Berdasarkan tingkat mengukuran, data
dikelompokan menjadi:
1. Data nominal merupakan data yang tidak dapat (tidak berkmakna) jika
diurutkan secara aritmetika.
2. Data ordinal, yaitu data yang bisa diurutkan tetapi tidak dapat (tidak
bermakna) jika dibandingkan.
3. Data interval, yaitu data yang dapat urutkan dan perbedaan antara nilai
data ada maknanya.
4. Data rasio, yaitu data yang dapat dirutkan, perbedan antara nilai data
bermakna dan rasio antar nilai data juga bermakna. Pada data rasio nilai 0
merupakan nilai sebenarnya.
Contoh 3. Suatu data berisi informasi nama hewan di suatu kebun binatang:
harimau
jerapah
buaya
unta
Data ini termasuk data nominal. Perhatikan bahwa data tersebut hanya menyatakan nama, jadi jika diurutkan tidak ada artinya.
Contoh 4. Suatu penelitian bertujuan untuk mengetahui tingkat kesukaan konsumen terhadap suatu produk. Variabel yang diamati adalah sebagai berikut:
Suka
Sedang
Tidak suka
Perhatikan bahwa data ini dapat diurutkan, namun selisih antar tingkat kesukaan
tidak bermakna.
Contoh 5. Temperatur di kota Palangkaraya merupakan data interval, sebab nilai
temperatur dapat diurutkan dan selisih antara nilai temperatur memiliki makna.
Misalnya pada pagi hari temperaurnya 23o dan pada siang hari 30o , perbedaaanya

10

BAB 1. POPULASI DAN SAMPEL

menyatakan bahwa pada siang hari temperaturnya 7o lebih panas dibanding pagi
hari. Perhatikan pula bahwa temperatur 0o tidak berarti tidak ada panas, yakni
nilai ini bukan nilai sebenarnya.
Contoh 6. Data penghasil 5 orang per bulan (dalam juta rupiah) adalah sebagai
berikut:
No. Urut. Penghasilan
1.
2
2.
4,5
3.
13
4.
0,5
5.
0,0
Sifat data ini adalah dapat urutkan, dapat dikurangkan antar nilai-nilainya dan
nilai 0 adalah nilai yang sebenarnya, yaitu tidak punya penghasilan. Dengan
demikian data ini termasuk data rasio.

Bab 2

Penyajian Data
2.1

Distribusi Frekuensi

Jika kita memiliki suatu data kuantitatif yang ukuran cukup besar, maka akan
berguna jika data tersebut dikelompokan menjadi interval atau klas yang lebih kecil. Tabel frekuensi mempartisi data menjadi kelas atau interval dan menampilkan
banyaknya nilai data yang termasuk pada setiap kelas.
Definisi 2.1.1.
• Kelas atau interval dibentuk sehingga setiap nilai data termasuk kedalam tepat satu kelas.
• Kelas berupa interval bilangan; jadi memiliki batas bawah dan batas atas.
• Titik tengah kelas adalah bilangan yang posisinya di tengah kelas.
• Lebar kelas menyatakan selisih antara batas atas dan batas bawah kelas
tersebut.
Lebar kelas =

N ilai data terbesar − N ilai data terkecil
banyaknya kelas

• Frekuensi kelas adalah banyaknya nilai yang termasuk suatu kelas.
• Frekuensi relatif adalah frekuensi dibagi banyaknya nilai data.
11

12

BAB 2. PENYAJIAN DATA

• Frekuensi Kumulatif suatu kelas adalah banyaknya seluruh nilai data yang
lebih kecil dari batas atas kelas tersebut.
• Frekuensi kumulatif relatif adalah frekuensi kumulatif dibagi banyaknya
data.
Contoh 7. Data hasil ujian mata kuliah Statistika 40 mahasiswa berikut akan disajikan dalam bentuk frekuensi distribusi dengan 6 kelas.:
78
60
68
67

60
76
87
58

45
65
95
78

65
60
54
65

80
55
67
89

95
54
58
85

40
75
87
76

40
84
56
68

46
48
43
64

55
58
56
60

Langkah-langkah membentuk tabel frekuensi:
1. Tentukan lebar kelas:
Lebarkelas =

95 − 40
= 9.16.
6

dibulatkan menjadi 10.
2. Tentukan kelas (interval kelas) sebagai berikut:
• Ambil nilai data terkecil sebagai batas bawah kelas pertama, dalam hal
ini adalah 40.
• Batas bawah kelas berikutnya = batas bawah nilai sebelumnya + 10. Jadi
batas bawah kelas kedua adalah 40 + 10 = 50.
• Batas bawah kelas diperoleh dengan mengambil nilai tepat di bawah batas
atas kelas berikutnya. Jadi batas kelas pertama adalah 59.
• Proses ini dilanjutkan untuk kelas-kelas berikutnya.
3. Sekarang setiap nilai data dapat dimasukan ke dalam kelas masing-masing.
Untuk menghitung frekuensi setiap kelas dapat menggunakan dengan bantuan
tally.

13

2.2. HISTOGRAM

Diperoleh tabel frekuensi sebagai berikut:

2.2

Interval Kelas

Frekuensi

Frekuensi
Relatif

Frekuensi
Kumulatif

40-49
50-59
60-69
70-79
80-89
90-99
Jumlah

5
9
12
5
6
2
40

0.125
0.225
0.325
0.125
0.15
0.05
1

5
14
27
32
38
40

Frekuensi
Kumulatif
Relatif
0.125
0.350
0.675
0.800
0.950
1.00

Histogram

Dari tbel frekuensi dapat disajikan bentuk visualnya. Histogram merupakan cara
yang cukup efektif untuk menyajikan data dalam bentuk visual. Pada histogram:
• setiap kelas dinyatakan dengan sebuah batang

• lebar batang menyatakan lebar kelas

• tinggi batang menyatakan frekuensi kelas atau frekuensi relatif kelas

• nilai dibawah setiap batang adalah titik tengah kelas.

Histogram frekuensi pada contoh 1 adalah

14

BAB 2. PENYAJIAN DATA

Bentuk histogram dari suatu sampel random menggambarkan bagaimana nilai
data berdistribusi pada populasi. Bentuk histogram dapat dikelompokan menjadi:
1. Simetris, yaitu histogram yang mentuknya (hampir) simetris terhadap suatu
sumbu.

2. Seragam, yaitu histogram yang frekuensi setiap kelasnya sama atau hampir
sama.

3. Menceng kiri atau menceng kanan, yaitu histogram yang ekornya menjulur
lebih panjang ke satu sisi. Jika ekornya lebih menjulur kekiri maka dinamakan menceng kekiri, jika ekornya lebih menjulur kekanan maka dinamakan
menceng kekanan.

4. Bimodal, yaitu histogram yang memiliki dua kelas dengan frekuensi tertetinngi
yang dipisahkan oleh kelas lainnya.

2.2. HISTOGRAM

15

16

BAB 2. PENYAJIAN DATA

Kadang-kadang kita ingin menyajikan histogram dengan bentuk tertentu. Diagram pareto adalah grafik batang yang disajikan secara urut berdasarkan tingginya.
Sebagai contoh, diagram pareto untuk contoh 1 adalah:

Grafik runtun waktu adalah grafik yang menggambarkan bagaimana data
berubah terhadap waktu.
Misalnya data mahasiswa UM Palangkaraya 10 tahun terakhir adalah
2003
3900

2004
4500

2005
4200

2006
3300

2007
3600

2008
3000

2009
3100

2010
3200

2011
3400

2012
3500

Grafik runtun waktu data ini adalah

2.3

Diagram Batang dan Daun

Diagram batang dan daun menyajikan data dalam bentuk susunan dan kelompok
tertentu. Didalam tabel frekuensi dan histogram, kita kehilangan informasi tentang nilai data. Di dalam diagram batang dan daun, informasi mengenai nilai data
asli tidak hilang.

2.3. DIAGRAM BATANG DAN DAUN

17

Prosedur membuat diagram batang-daun:
1. Bagi digit tiap nilai data menjadi dua bagian. Bagian paling kiri dinamakan
batang dan bagian kanan dinamakan daun.
2. Susun semua batang secara vertikal mulai dari nilai terkecil hingga nilai terbesar.
3. Tuliskan semua daun yang batangnya sama pada baris batang yang sama, lalu
susun daun dengan urutan makin membesar.
Contoh 8. Data nilai ujian Statistika pada contoh 1 akan disajikan dalam diagram batang daun. Digit pertama sebagai batang dan digit kedua sebagai daun.
Berdasarkan prosedur di atas diperoleh
0 0 3 6 8
4
5
4 4 5 5 6 6 8 8
6
0 0 0 0 4 5 5 5 7 7 8 8
7
5 6 6 8 8
8
0 4 5 7 7 9
9
5 5

18

BAB 2. PENYAJIAN DATA

Bab 3

Ringkasan Data
3.1

Ukuran Kecenderungan Pusat

Dalam keseharian kita sering mendengar ungkapan seperti:
• Umumnya orang Indonesia makan nasi.
• Sebagian besar siswa lulus UAN.
• Pendapatan per kapita rata-rata di Palangkaraya 4 juta rupiah per bulan.

Ungkapan-ungkapan tersebut merupakan ungkapan kecenderungan suatu keadaan.
Di dalam bagian ini kita akan meninjau dari sudut statistika cara menyapaikan
ungkapan-ungkapan tersebut.
Modus suatu data adalah nilai data yang paling banyak frekuensinya.
Contoh 9. Data banyaknya anak 10 rumah tangga adalah sebagai berikut:
2 0 2 1 2 3 4 3 2 1
Nilai data 2 memiliki frekuensi paling banyak, oleh karena itu modusnya adalah 2.
Median adalah nilai data yang posisinya ditengah setelah data diurutkan. Median
data dapat dicari sebagai berikut:
1. Urutkan data dari nilai terkecil hingga terbesar.
2. Jika banyaknya nilai data ganjil, maka median = nilai yang posisinya ditengah.
3. Jika banyaknya nilai data genap, maka
median =

jumlah dua nilai yang ditengah
.
2
19

20

BAB 3. RINGKASAN DATA

Contoh 10. Hasil pengukuran tinggi badan 11 mahasiswa (dalam kg) adalah
67 60 70 55 58 76 63 76 81 65 72
Setelah diurutkan maka menjadi
55 58 60 63 65 67 70 72 76 76 81
Karena banyaknya nilai data ada 11, maka mediannya adalah nilai yang posisinya
ditengah, yaitu nilai ke 6. Dengan demikian mediannya adalah 67.
Contoh 11. Data pendapatan per bulan 10 orang adalah sebagai berikut (dalam
juta rupiah)
4 4 6 3 5 3 2 5 1 3
Setelah diurutkan, maka data tersebut menjadi
1 2 3 3 3 4 4 5 5 6
Karena banyaknya observasi 10 (genap), maka mediannya adalah
nilai ke 5 + nilai ke 6
3+4
=
= 4.5.
2
2
Mean atau mean aritmetika suatu sampel adalah jumlah seluruh nilai data
dibagi ukuran sampel. Mean suatu sampel berukuran n dengan nilai-nilai data
x1 , x2 , · · · , xn , ditulis x̄. Jadi
n
x1 + x2 + · · · + xn
1X
mean = x̄ =
=
xi .
n
n i=1
median =

Contoh 12. Nilai rapor semua pelajaran seorang siswa adalah 7, 8, 6, 7, 6, 8, 7, 9, 6, 7.
Mean nilai rapornya adalah
7+8+6+7+6+8+7+9+6+7
71
=
= 7.1.
x̄ =
10
10
Mean memiliki sifat sensitif terhadap nilai data ekstrim, dalam arti bahwa jika
terdapat nilai data yang sangat kecil atau sangat besar, maka mean mudah berubah
secara ekstrim.
Contoh 13. Data observasi tingkat penghasilan 10 orang di Palangkaraya per bulan
adalah sebagai berikut (dalam juta rupiah): 1, 3, 2, 4, 3, 100, 3, 4, 2, 4. Di dalam
contoh ini terdapat orang yang penghasilannya 100 juta per bulan. Mean data ini
adalah
1 + 3 + 2 + 4 + 3 + 100 + 3 + 4 + 2 + 4
= 12.6,
x̄ =
10
padahal umumnya ke 10 orang berpenghasilan dibawah 5 juta. Hal ini terjadi
karena ada nilai data yang ekstrim, yaitu 100.

3.1. UKURAN KECENDERUNGAN PUSAT

21

Trimmed mean atau mean yang dipangkas relatif tidak sensitif terhadap
nilai data ekstrim. Trimmed mean adalah mean suatu data yang telah dipangkas
sebagian data, umumnya digunakan pemangkasan 5 persen.

22

BAB 3. RINGKASAN DATA

Prosedur mencari trimmed mean 5 persen
1. Urutkan data dari nilai terkecil hingga nilai terbesar.
2. Hapus 5 persen bawah dan 5 persen atas data. Jika 5 persen tersebut tidak
menghasilkan bilangan bulat, bulatkan ke bilangan bulat terdekat.
3. Hitung mean 90 persen data yang tersisa.
Contoh 14. Data penghasilan per bulan 20 orang dalam juta rupiah adalah sebagai
berikut
3 2 3 1 4 5 4 6 3 5 4 100 4 5 7 8 4 6 7
Untuk mencari trimmed mean 5 persen pertama-tama data diurutkan

6

1 2 3 3 3 4 4 4 4 4 5 5 5 6 6 6 7 7 8 100
Banyaknya nilai data adalah 20, sehingga 5 persen dari 20 adalah 1.
Dihilangkan 5 persen (satu nilai data) bawah dan atas data menjadi
2 3 3 3 4 4 4 4 4 5 5 5 6 6 6 7
Mean yang dipangkas adalah mean data terakhir, yaitu

7

8

1
(2 + 3 + 3 + 3 + 4 + 4 + 4 + 4 + 4 + 5 + 5 + 5 + 6 + 6 + 6 + 7 + 7 + 8) = 4.78.
18
Kadang-kadang kita memiliki data yang nilainya dapat dikelompokan menjadi k
nilai berbeda. Misalkan nilai data x1 , x2 , · · · , xk P
berturut-turut memiliki frekuensi
f1 , f2 , · · · , fk . Ini berarti data ini memiliki n = ki=1 fi nilai data dengan nilai xi
terjadi fi kali. Mean data demikian dapat dihitung sebagai berikut
1
x̄ = (f1 x1 + f2 x2 + · · · + fk xk ).
n
dengan n = fi + f2 + · · · + fk .
Contoh 15. Berikut adalah data hasil observasi usia mahasiswa pada suatu kelas
x̄ =

Usia
16
17
18
19
20
21
22

Frekuensi
2
4
7
8
6
3
2

23

3.2. VARIAN

Banyaknya observasi adalah n = 2 + 4 + 7 + 8 + 6 + 3 + 2 = 32. Mean data
tersebut adalah
1
605
x̄ = (2 · 16 + 4 · 17 + 7 · 18 + 8 · 19 + 6 · 20 + 3 · 21 + 2 · 22) =
= 18.91.
32
32
Kadang-kadang nilai data yang akan dicari meannya sangat besar. Untuk mempermudah mencari mean data yang nilai-nilainya sangat besar dapat digunakan
transformasi:
yi = xi − c
dengan c suatu konstanta.
Dengan tranfomasi tersebut, maka diperoleh

x̄ = ȳ + c.
Contoh 16. Suatu eksperimen untuk mengukur kecepatan cahaya menghasilkan
hasil pengukuran sebagai berikut (dalam km/detik):
300, 009 299, 999 299, 998 300, 099 300, 008.
Untuk mencari mean data tersebut dapat digunakan tranformasi
yi = xi − 300, 000,
dan diperoleh nilai-nilai yi :
9

−1

− 2 99 8,

dan

1
ȳ = (9 − 1 − 2 + 99 + 8) = 22.6.
5
Dengan demikian, mean hasil pengukuran kecepatan cahaya tersebut adalah
x̄ = ȳ + 300, 000 = 22.6 + 300, 000 = 300, 022.6.

3.2

Varian

Kita sering mendengar pernyataan seperti ”Tingkat pendapatan orang Indonesia
sangat bervariasi”, ”Hasil nilai ujian nasional cukup beragam”, ”Tinggi tanaman
padi di sawah sangat seragam”, dan sebagainya. Ungkapan semacam ini merupakan suatu cara untuk menyatakan kecenderungan perbedaan antara individu.
Range data x1 , x2 , · · · , xn adalah selisih antara nilai data terbesar dan nilai
data terkecil.

24

BAB 3. RINGKASAN DATA

Contoh 17. Nilai ujian 10 orang siswa adalah 5, 6, 4, 7, 8, 7, 10, 6, 7, 4.
Range data tersebut adalah 10 − 4 = 6.

Diketahui x1 , x2 , · · · , xn data sampel berukuran n dan x̄ mean data tersebut.
Deviasi nilai data xi terhadap mean x̄ adalah selisih antara xi dan x̄, yaitu
deviasi = xi − x̄.
Varian sampel, ditulis s2 , dari data x1 , x2 , · · · , xn didefinisikan
n

1 X
(xi − x̄)2 .
s =
n − 1 i=1
2

Varian sampel menggambarkan variabilitas data sampel. Jika s2 adalah varian
sampel, maka s dinamakan deviasi standar sampel.
Contoh 18. Hitunglah varian sampel setiap data berikut:
Data A: 5, 3, 4, 6, 2.
Data B: -2, -1, 11, 4, 8.
Mean data A adalah x̄ = (5 + 3 + 4 + 6 + 2)/5 = 4; dengan demikian varian
sampel data A adalah

1
(5 − 4)2 + (3 − 4)2 + (4 − 4)2 + (6 − 4)2 + (6 − 4)2 + (2 − 4)2
4
10
=
= 2.5,
4

dan deviasi standar data A adalah s = 2.5 = 1.58.
s2 =

Mean data B adalah x̄ = (−2 − 1 + 11 + 4 + 8)/5 = 4; dengan demikian varian
sampel data B adalah

1
(−2 − 4)2 + (−1 − 4)2 + (11 − 4)2 + (4 − 4)2 + (8 − 4)2
4
126
=
= 31.5
4

dan deviasi standar data B adalah s = 31.5 = 5.61.
s2 =

Perhatikan bahwa meskipun data A dan data B memiliki mean sama, namun
variannya berbeda. Varian data B lebih besar dibanding varian data A, yang
berarti bahwa data B lebih bervariasi dibanding data A.

25

3.3. PERSENTIL

3.3

Persentil

Diketahui bilangan p dengan 1 ≤ p ≤ 99. Persentil ke p dari suatu data adalah
suatu nilai sehingga p persen data berada pada atau dibawah nilai tersebut dan
(100 − p) persen data berada pada atau di atas nilai tersebut.
Quartil adalah persentil yang membagi data menjadi empat.
1. Quartil pertama ditulis Q1 , adalah persentil ke 25 .
2. Quartil kedua ditulis Q2 , adalah median.
3. Quartil ketiga ditulis Q3 adalah persentil ke 75.
Prosedur mencari quartil:
1. Urutkan data dari nilai terkecil sampai dengan nilai terbesar
2. Posisi Q1 = 0.25(n + 1).
3. Posisi Q2 = 0.5(n + 1)
4. Posisi Q3 =0.75(n+1).
Interquartil = Q3 − Q1 .

Contoh 19. Data hasil ujian 40 mahasiswa
78
60
68
67

60
76
87
58

45
65
95
78

65
60
54
65

80
55
67
89

95
54
58
85

40
75
87
76

40
84
56
68

46
48
43
64

55
58
56
60

Setelah data diurutkan maka diperoleh :
Posisi Q1 = 0.25(40 + 1) = 10.25.
Q1 = nilai ke 10 + 0.25( nilai ke 11 − nilai ke 10)
= 55 + 0.25 = 55.25.

26

BAB 3. RINGKASAN DATA

Posisi Q2 = 0.5(40 + 1) = 20.5
nilai ke 20 + nilai ke 21
2
64 + 65
=
= 64.5.
2

Q2 =

Posisi Q3 = 0.75(40 + 1) = 30.75
Q3 = nilai ke 30 + 0.75( nilai ke 31 − nilai ke 30)
= 76 + 0.75(78 − 76) = 77.50.
Interquartil=Q3 − Q1 = 77.50 − 55.25 = 22.5.

3.4

Box Plot

Quartil bersama dengan nilai data terbesar dan terkecil menghasilkan ringkasan
limabilangan dan sebaran data. Kelima bilangan yaitu:
nilai data terkecil, Q1 , median, Q3 dan nilai data terbesar.
Kelima bilangan dapat digunakan untuk membuat sketsa grafik data yang dinamakan box plot.
Prosedur membuat box plot:
1. Gambarkan sebuah skala vertikal yang dapat mencakup nilai data terkecil dan
nilai data terbesar.
2. Gambarkan sebuah kotak dari Q1 ke Q3 di sebelah kanan skala tersebut.
3. Berilah garis mendatar pada kotak tersebut di ketinggian median.
4. Gambarkan garis vertikal dari Q1 ke nilai data terkecil dan dari Q3 ke nilai
data terbesar.
Contoh 20. Grafik box-plot data hasil ujian 40 mahasiswa pada contoh terdauhulu.

3.5. TEOREMA CHEBYSHEV

3.5

27

Teorema Chebyshev

Teorema 3.5.1. Diketahui x̄ dan s berturut-turut adalah mean sampel dan deviasi
standar sampel dengan s > 0. Jika k ≥ 1 maka setidaknya 100(1 − 1/k 2 ) persen
data berada di dalam interval x̄ − ks sampai dengan x̄ + ks.

Contoh 21. Jika k = 2 maka setidaknya ada 100(1 − 1/22 ) = 100 · 3/4 = 75 persen
data berada di dalam interval x̄ − 2s sampai dengan x̄ + 2s.
Contoh 22. Nilai ujian 20 siswa adalah sebagai berikut:
5 7 6 8 6 5 4 8 9 9 7 8 5 4 6 7 6 8 6 7.
Dari data tersebut diperoleh: x̄ = 6.55 dan s = 1.5035.
Jika k = 3/2, maka setidaknya ada

100(1 − 1/(3/2)2 ) = 100 · 5/9 = 55.55

persen
data berada di dalam interval 6.55 − 32 1.5035 sampai dengan 6.55 +

3
1.5035.
2
Dengan kata lain setidaknya 55.55 persen data berada di dalam interval 4.29475
sampai dengan 8.8052.
Dapat diperiksa bahwa nilai data yang berada di dalam interval tersebut adalah
5 7 6 8 6 5 8 7 8 8 6 7 6 8 7,
yaitu ada 15 (lebih dari 55.55 persen) nilai data yang berada di dalam interval
tersebut.

28

BAB 3. RINGKASAN DATA

Bab 4

Peluang
4.1

Ruang Sampel

Suatu eksperimen dilaksanakan dengan tujuan untuk memperoleh hasil (outcome).
Eksperimen random adalah suatu eksperimen yang dapat dilakukan berkali-kali
pada kondisi yang sama dan hasilnya tidak dapat ditentukan dengan pasti sebelum eksperimen tersebut selesai. Ini berarti hasil yang akan terjadi dari suatu
eksperimen random menganndung suatu ketidakpastian. Meskipun hasilnya tidak
dengan secara pasti dapat ditentukan, namun kita masih dapat menentukan semua
hasil yang mungkin terjadi.
Definisi 4.1.1. Ruang sampel, ditulis S, dari suatu eksperimen random adalah
himpunan semua hasil (outcome) yang mungkin terjadi.
Definisi 4.1.2. Pertistiwa E adalah himpunan bagian dari ruang sampel S. Peristiwa E dikatakan terjadi, jika E memiliki anggota.
Selanjutnya peristiwa akan dituliskan dangan huruf A, B, C, D, E, F dan sebagainya.
Definisi 4.1.3. Peristiwa E ∩ F adalah peristiwa terjadinya E dan F .
Peristiwa E c adalah peritstiwa tidak terjadinya E.
Dua peristiwa E dan F dikatakan saling saling jika E ∩ F = ∅, yakni jika kedua
peristiwa tidak memiliki anggota bersama.
Definisi 4.1.4. Peristiwa elementer adalah peristiwa yang memiliki tepat satu
anggota.
Contoh 23. Suatu eksperimen random melontarkan dua mata uang logam satu
kali. Peristiwa yang diamati adalah sisi yang menghadap ke atas.
29

30

BAB 4. PELUANG

Jika sisi angka ditulis a dan sisi gambar ditulis g, maka ruang sampelnya adalah
S = {aa, ag, ga, gg}.
Jika E adalah peristiwa terjadinya sisi a tepat satu kali, maka dapat ditulis
E = {ag, ga}.
Jika F peristiwa terjadinya sisi gambar setidaknya satu kali, maka dapat ditulis
F = {ag, ga, gg}.
Peristiwa E ∩ F berarti peristiwa terjadi sisi angka sebanyak satu kali dan
gambar satu kali, yaitu
E ∩ F = {ag, ga}.

Peristiwa E c menyatakan peristiwa tidak terjadinya E, yaitu tidak munculnya sisi
angka sebanyak satu kali, dan dapat ditulis
E c = {gg, aa}.
Contoh 24. Sebuah dadu dilontarkan satu kali dan diamati banyaknya spot sisi
yang menghadap ke atas.
Ruang sampelnya dapat ditulis
S = {1, 2, 3, 4, 5, 6}.
Peristiwa elementernya adalah {1}, {2}, {3}, {4}, {5} dan {6}.
Jika A peristiwa terjadinya sisi genap dan B peristiwa terjadinya sisi ganjil,
A = {2, 4, 6}
B = {1, 3, 5}

maka A dan B merupakan peristiwa yang saling asing, karena A ∩ B = ∅.
Contoh 25. Satu mata uang logam dilontarkan tiga kali.
Ruang sampelnya adalah
S = {aaa, aag, aga, gaa, agg, gag, gga, ggg}.
Jika E adalah peristiwa munculnya sisi angka paling banyak satu kali, maka dapat
ditulis
E = {agg, gag, gga, ggg}.
Jika F adalah peristiwa munculnya sisi gambar satu kali, maka dapat ditulis
F = {aag, aga, gaa}.

31

4.2. PELUANG

Peristiwa E ∪ F adalah peristiwa munculnya sisi angka paling banyak satu kali
atau peristiwa munculnya sisi gambar dua kali. Jadi
E ∪ F = {agg, gag, gga, ggg, aag, aga, gaa}.

Contoh 26. Sebuah dadu dilontarkan dua kali. Pasangan (a, b) menyatakan sisi
yang muncul pada lontaran a dan pada lontaran kedua b. Ruang sampelnya adalah
S = { (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6),
(2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),
(3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6),
(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6),
(5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6),
(6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)}
Jika E peristiwa munculnya jumlah kedua lontaran 10, maka dapat ditulis
E = {(4, 6), (5, 5), (6, 4)}.

Jika F peristiwa munculnya lontaran pertama spot 4, maka dapat ditulis
F = {(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6)}.

Contoh 27. Misalkan kita ingin meramalkan ketinggian sebuah roket yang ditembakan dari permukaan bumi. Ruang sampelnya adalah semua bilangan pada interval 0 sampai dengan tak hingga,
S = {x : 0 ≤ x < takhingga}.

Jadi ruang sampel ini memiliki tak hingga anggota.

4.2

Peluang

Di dalam suatu percobaan random, akan terjadinya suatu peristiwa tidak dapat
ditentukan secara pasti. Tingkat kepastian atau ketidakpastian ini diukur dengan
suatu ukuran yang dinamakan peluang (probability).
Definisi 4.2.1. (Pendekatan klasik peluang) Diketahui peristiwa E dapat terjadi
dalam h cara berbeda dari seluruh n cara yang semuanya memiliki kemungkinan
sama. Peluang peristiwa E, ditulis P (E), adalah
P (E) =

h
.
n

32

BAB 4. PELUANG

Pengertian peluang secara klasik mengandung arti bahwa setiap peristiwa elementer memiliki peluang yang sama, yaitu sebesar N1 .
Contoh 28. Sebuah mangkok berisi 5 bola merah dan 4 bola biru. Dari mangkok
tersebut diambil tanpa pilih-pilih sebuah bola. Peluang terambilnya bola merah
adalah
5
P (merah) = ,
9
dan peluang terambilnya bola biru adalah
4
P (biru) = .
9
Definisi 4.2.2. (Pendekatan frekuensi) Jika setelah diulang n percobaan, dengan
n besar, suatu peristiwa diketahui terjadi h kali, maka peluang peristiwa tersebut
adalah h/n.
Contoh 29. Jika satu mata uang logam dilontarkan 1000 kali dan diperoleh sisi
gambar terjadi 512 kali, maka peluang terjadinya sisi gambar adalah 512/1000 =
0.512.
Pada kenyataannya tidak semua peristiwa elementer memiliki peluang yang
sama, misalnya peluang sebuah mesin jet macet tentu tidak sama dengan peluang
mesin tersebut tidak macet. Oleh karena itu pengertian klasik peluang kurang
tepat untuk berbagai fenomena yang terjadi sehari-hari.
Perhatikan bahwa pada pengertian klasik, banyaknya anggota ruang sampel berhingga.
Pada kenyataannya ada ruang sampel yang jumlah anggotanya tak hingga. Ini berarti pengertian klasik peluang tidak dapat digunakan jika banyaknya anggota
ruang sampel tak hingga.
Definisi 4.2.3. Diketahui S ruang sampel. Untuk setiap peristiwa E bagian S
dihubungkan dengan suatu bilangan yang ditulis P (E) yang memenuhi sifat-sifat
berikut:
1. 0 ≤ P (E) ≤ 1.
2. P (S) = 1.
3. P (E1 ∪ E2 ∪ E3 ∪ · · · ) = P (E1 ) + P (E2 ) + P (E3 ) + · · · , dengan E1 , E2 , E3 , · · ·
adalah peristiwa yang saling asing.
Jika P memenuhi ketiga sifat, maka P dinamakan peluang, dan P (E) dinamakan
peluang terjadinya peristiwa E.

33

4.2. PELUANG

Sifat (1) menyatakan bahwa peluang suatu peristiwa adalah suatu nilai numerik
yang besarnya dari 0 hingga 1.
Sifat (2) menyatakan bahwa perstiwa terjadinya ruang sampel adalah pasti.
Sifat (3) menyatakan bahwa peluang gabungan peristiwa yang saling asing sama
dengan jumlah peluang masing-masing peristiwa.
Peluang merupakan ukuran numerik kemungkinan terjadinya suatu peristiwa.
Nilai peluang yang mendekati satu berarti semakin besar kemungkinan persistiwa
tersebut terjadi. Sebaliknya jika peluang suatu peristiwa pendekati nilai nol, berarti semakinkecil kemungkinan peristiwa tersebut terjadi. Jika suatu peristiwa
memiliki peluang 1 artinya peristiwa tersebut pasti terjadi, sedangkan jika suatu
peristiwa memiliki peluang 0 artinya peristiwa tersebut tidak mungkin terjadi.
Contoh 30. Frekuensi relatif pada contoh merupakan peluang. Pada kolom tersebut
nilai frekiensi relatif berada pada interval 0 hingga 1, jumlah semua frekuensi
relatif adalah 1 dan frekuensi relatif gabungan kelas interval sama dengan jumlah
frekuensi relatif kelas interval.
Contoh 31. Tiga mata uang dilontarkan satu kali dan diamati sisi yang menghadap
ke atas. Ruang sampelnya adalah
S = {aaa, aag, aga, gaa, agg, gag, gga, ggg}.
Dianggap setiap peristiwa elementer memiliki peluang sama, yaitu 18 . Jika E menyatakan peristiwa terjadinya sisi angka satu kali dan F menyatakan peristiwa terjadinya sisi gambar paling sedikit dua kali, maka E dan F dapat dituliskan
E = {agg, gga, gag} dan F = {ggg, gga, gag, agg}.
P (E) = P (agg, gga, gag)
= P (agg) + P (gga) + P (gag)
= 81 + 81 + 18
= 38 .

(4.1)

P (F ) = P (ggg, gga, gag, agg)
= P (ggg) + P (gga) + P (gag) + P (agg)
= 81 + 18 + 18 + 81
= 21 .

(4.2)

Contoh 32. Sebuah mangkok berisi 10 kelereng merah, 30 kelereng putih, 25 kelereng biru dan 15 kelereng orange. Akan diambil satu kelereng. Berapa peluang
terambilnya kelereng

34

BAB 4. PELUANG

(a) putih
(b) orange atau merah
(c) bukan biru
(d) merah, putih atau biru
(e) bukan merah dan bukan biru
Penyelesaian: Misalkan M, P, B dan O berturut-turut menyatakan kelereng
warna merah, putih, biru dan orange. Banyaknya seluruh kelereng adalah 10 +
30 + 25 + 15 = 80.
(a) P (P ) =

30
80

= 0.375.

(b) P (O ∪ M ) =

15+10
80

= 0.3125.

(c) P (B c ) = 1 − P (B) = 1 −
(d) P (M ∪ P ∪ B) =

10+30+25
80

20
75

= 1 − 0.3125 = 0.6875.

= 0.8125.

(e) P (M c ∩ B c ) = P ((M ∪ B)c ) = 1 − P (M ∪ B) = 1 −

4.3

10+25
80

= 0.5625.

Peluang Bersyarat

Dalam suatu eksperimen random peluang terjadinya suatu peristiwa bisa tergantung terjadinya peristiwa lain. Sebagi contoh, peluang lahirnya anak kedua perempuan bisa tergantung apakah anak pertama laki-laki atau perempuan.
Diketahui E dan F adalah peristiwa. Peluang terjadinya E jika diketahui peristiwa
F telah terjadi dinamakan peluang bersyarat (conditional probability), dituliskan
P (E|F ), dan didefinisikan
P (E|F ) =

P (E ∩ F )
.
P (F )

Contoh 33. Sebuah mata uang logam dilontarkan dua kali, dan peluang setiap
peristiwa elementer sama. Berapa peluang terjadinya sisi a pada lontaran kedua
jika diketahui pada lontaran pertama sisi g telah terjadi?
Misalkan E peristiwa terjadinya sisi a pada lontaran kedua dan F peristiwa terjadinya sisi g pada lontaran pertama. Jadi E = {aa, ga} dan F = {gg, ga}.
Peluang yang dicari adalah
P (E|F ) =

P (E ∩ F )
P (ga)
1/4
1
=
=
= .
P (F )
P (gg, ga)
2/4
2

35

4.3. PELUANG BERSYARAT

Contoh 34. Suatu mangkok berisi tujuh bola hitam dan lima bola putih. Diambil dua bola dari dalam mangkok tersebut dan bola yang telah terambil tidak
dikembalikan kedalam mangkok. Anggap setiap bola memiliki peluang sama untuk terambil. Berapa peluang bola yang terambil keduanya adalah bola hitam.
Misalkan F dan E berturut-turut peristiwa bola pertama dan bola kedua adalah
hitam. Karena bola pertama yang terambil hitam, maka ada enam bola hitam dan
lima bola putih yang tersisa di dalam mangkok, dan dengan demikian
P (E|F ) =
Karena P (F ) =

7
,
12

6
.
11

maka peluang terambilnya kedua bola hitam adalah
P (E ∩ F ) = P (F )P (E|F ) =

7 6
42
=
.
12 11
132

Contoh 35. Pada suatu perguruan tinggi, s25 persen mahasiswa gagal matematika,
15 persen mahaasiswa gagal fisika, dan 10 persen maha siswa gagal matematika
dan ilmu fisika. Seorang mahasiswa dipilih secara random.
(a) Jika ia gagal fisika, berapa peluang ia gagal matematika?
(b) Jika ia gagal matematika, berapa peluang ia gagal fisika?
(c) Berapa peluang ia gagal matematika atau gagal fisika?
Penyelesaian: Tuliskan M = peristiwa mahasiswa yang gagal matematika, F =
persitiwa mahasiswa yang gagal fisika. Diperoleh
P (M ) = 0.25,

P (F ) = 0.15,

P (M ∩ F ) = 0.10

(a) Peluang ia gagal matematika, diketahui ia gagal fisikaa adalah
P (M |F ) =

P (M ∩ F )
0.10
2
=
=
P (F )
0.15
3

(b) Peluang ia gagal fisika, diketahui ia gagal matematika adalah
P (F ∩ M ) =

P (F ∩ M )
0.10
2
=
=
P (M )
0.25
5

(c) Peluang ia gagal matematika atau gagal fisika adalah
P (M ∪ F ) = P (M ) + P (F ) − P (M ∩ F ) = 0.25 + 0.15 − 0.10 = 0.30

36

BAB 4. PELUANG

Peristiwa E dan F dikatakan independen, jika peluang terjadinya peristiwa
E tidak tergantung apakah peristiwa F terjadi atau tidak terjadi. Dalam hal ini
P (E|F ) = P (E) dan berlaku
P (E ∩ F ) = P (E).P (F ).
Jadi peristiwa E dan F independen jika peluang terjadinya kedua peristiwa bersamaan
sama dengan hasil kali peluang terjadinya masing-masing peristiwa.
Contoh 36. Satu mata uang logam dilontarkan dua kali. Jika E peristiwa munculnya sisi a pada lontaran pertama dan F peristiwa munculnya sisi g pada lontaran
kedua, yaitu
E = {aa, ag} dan F = {ag, gg}.
Jika setiap peristiwa elementer memiliki peluang sama, maka
P (E ∩ F ) = P (ag) =

1
4

1
1 1
· = ,
2 2
4
sehingga P (∩F ) = P (E)P (F ), dengan kata lain E dan F adalah peristiwa yang
independen.
P (E)P (F ) = P (aa, ag)P (ag, gg) =

Contoh 37. Dua dadu dilontarkan satu kali. A menyatakan peristiwa munculnya
jumlah spot kedua sisi adalah enam dan B menyatakan peristiwa munculnya spot
sisi dadu pertama empat. Diperoleh
P (A ∩ B) = P ({4, 2}) =

1
36

dan

5 1
5
· =
,
36 6
216
dan karena P (A ∩ B) 6= P (A)P (B), maka peristiwa A dan B tidak independen.
Peristiwa E1 , E2 , · · · , En dikatakan independen, jika untuk setiap r ≤ n berlaku
P (A)P (B) =

P (E1′ ∩ E2′ ∩ · · · ∩ Er ) = P (E1′ ) · P (E2′ ) · · · P (Er ).

Bab 5

Variabel Random
Dalam suatu eksperimen random dapat terjadi peneliti tidak tertarik pada outcomenya tetapi barangkali lebih tertarik pada nilai numerik yang berkaitan dengan
outcome tersebut. Misalnya dalam percobaan melontarkan tiga mata uang sekali,
mungkin peneliti lebih tertarik untuk mengamati banyaknya suatu sisi terjadi dari
pada mengamati sisi apa saja yang menghadap ke atas.
Definisi 5.0.1. Variabel random adalah suatu fungsi yang domainnya ruang sampel dan nilainya bilangan real. Selanjutnya variabel random ditulis dengan notasi
X. Jika c adalah peristiwa elementer, maka nilai variabel random X di c ditulis
X(c). Jika nilai X(c) adalah x maka ditulis X(c) = x.
Contoh 38. Dua mata uang logam dilontarkan satu kali. Jika X menyatakan
banyaknya sisi a terjadi, maka X merupakan variabel random. Nilai variabel random pada setiap anggota ruang sampel adalah sebegai berikut:
X(gg) = 0,

5.1

X(ag) = 1,

X(ga) = 1,

X(aa) = 2.

Variabel Random Diskrit

Variabel random X dikatakan variabel random diskrit jika nilai variabel random
tersebut terhitung, yakni banyaknya nilai berhingga atau dapat dituliskan sebagai
x 1 , x 2 , x3 , · · · .
Pada Contoh 38, X merupakan variabel random diskrit. .

37

38

BAB 5. VARIABEL RANDOM

Contoh 39. Tiga mata uang dilontarkan satu kali. Jika variabel random X menyatakan banyaknya sisi angka terjadi, maka nilai-nilai X adalah
X(ggg) = 0
X(aaa) = 3

X(agg) = X(gag) = X(gga) = 1
X(aag) = X(aga) = X(gaa) = 2

Contoh 40. Dua dadu dilontarkan satu kali. Variabel random X menyatakan
banyaknya jumlah bintik kedua sisi yang menghadap ke atas. Nilai-nilai variabel
random X aadalah
X((1, 1)) = 2
X((2, 1)) = 3
X((3, 1)) = 3
X((4, 1)) = 5
X((5, 1)) = 6
X((6, 1)) = 7

X((1, 2)) = 3
X((2, 2)) = 4
X((3, 2)) = 5
X((4, 2)) = 6
X((5, 2)) = 7
X((6, 2)) = 8

X((1, 3)) = 4
X((2, 3)) = 5
X((3, 3)) = 6
X((4, 3)) = 7
X((5, 3)) = 8
X((6, 3)) = 9

X((1, 4)) = 5
X((2, 4)) = 6
X((3, 4)) = 7
X((4, 4)) = 8
X((5, 4)) = 9
X((6, 4)) = 10

X((1, 5)) = 6
X((2, 5)) = 7
X((3, 5)) = 8
X((4, 5)) = 9
X((5, 5)) = 10
X((6, 5)) = 11

X((1, 6)) = 7
X((2, 6)) = 8
X((3, 6)) = 9
X((4, 6)) = 10
X((5, 6)) = 11
X((6, 6)) = 12

Jika X variabel random diskrit, maka peluang variabel random X bernilai x
ditulis P (X = x). Pada Contoh 39 misalnya, variabel random X bernilai 2 jika
dan hanya jika peristiwa {aag}, {aga} dan {gaa} terjadi. Ini berarti peluang X = 2
sama dengan peluang terjadinya peristiwa {aag, aga, gaa}, sehingga diperoleh
3
P (X = 2) = P ({aag, aga, gaa}) = .
8
Perhatikan bahwa nilai P (X = x) tergantung pada peristiwa yang dikaitkan
dengan nilai variabel random x. Dengan demikian peluang variabel random X
bergantung pada nilai x, dengan kata lain P (X = x) merupakan fungsi dari x.
Oleh karena itu dapat dituliskan
f (x) = P (X = x).
Selanjutnya f (x) dinamakan fungsi peluang atau distribusi peluang variabel
random X.
Contoh 41. Pada Contoh 39, distribusi peluangnya adalah
f (0)
f (1)
f (2)
f (3)

= P (X
= P (X
= P (X
= P (X

= 0) = P (ggg) = 81
= 1) = P (agg, gag, gga) =
= 2) = P (aag, aga, gaa) =
= 3) = P (aaa) = 81

3
8
3
8

39

5.1. VARIABEL RANDOM DISKRIT

Contoh 42. Pada Contoh 40, distribusi peluangnya adalah
f (2)
f (3)
f (4)
f (5)
f (6)
f (7)
f (8)
f (9)
f (10)
f (11)
f (12)

= P (X
= P (X
= P (X
= P (X
= P (X
= P (X
= P (X
= P (X
= P (X
= P (X
= P (X

1
= 2) = P ((1, 1)) = 36
2
= 3) = P ((1, 2)(2, 1)) = 36
3
= 4) = P ((1, 3), (2, 2), (3, 1)) = 36
4
= 5) = P ((1, 4), (2, 3), (3, 2), (4, 2)) = 36
5
= 6) = P ((1, 5), (2, 4), (3, 3), (4, 2), (5, 1)) = 36
= 7) = P ((1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)) =
5
= 8) = P ((2, 6), (3, 5), (4, 4), (5, 3), (6, 2)) = 36
4
= 9) = P ((3, 6), (4, 5), (5, 4), (6, 3)) = 36
3
= 10) = P ((4, 6), (5, 5), (6, 4)) = 36
2
= 11) = P ((5, 6), (6, 5)) = 36
= 12) = P ((6, 6)) = 16

6
36

Fungsi distribusi kumulatif atau fungsi distribusi, ditulis F (x), adalah peluang variabel random X bernilai lebih kecil atau sama dengan x. Jadi
F (x) = P (X ≤ x).

40

BAB 5. VARIABEL RANDOM

Contoh 43. Perhatikan kembali Contoh 39. Distribusi kumulatifnya dalah

F (0)
F (1)
F (2)
F (3)

= P (x ≤ 0) = P (X
= P (x ≤ 1) = P (X
= P (x ≤ 2) = P (X
= P (x ≤ 3) = P (X

= 0) = 18
= 0) + P (X = 1) = 21
= 0) + P (X = 1) + P (X = 2) = 87
= 0) + P (X = 1) + P (X = 2) + P (X = 3) = 1

5.2. NILAI HARAPAN VARIABEL RANDOM DISKRIT

41

Contoh 44. Distribusi kumulatif pada Contoh 40 adalah
F (2)
F (3)
F (4)
F (5)
F (6)
F (7)
F (8)

=
=
=
=
=
=
=

P (x ≤ 2) = P (X
P (x ≤ 3) = P (X
P (x ≤ 4) = P (X
P (x ≤ 5) = P (X
P (x ≤ 6) = P (X

1
= 2) = 36
= 2) + P (X
= 2) + P (X
= 2) + P (X
= 2) + P (X

3
= 3) = 36
6
= 3) + P (X = 4) = 36
= 3) + P (X = 4) + P (X = 5) = 10
36
= 3) + P (X = 4) + P (X = 5) + P (X = 6)

15
36

P (x ≤ 7) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
+P (X = 7) = 21
36
= P (x ≤ 8) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
+P (X = 7) + P (X = 8) =
26
36

= P (x ≤ 9) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
+P (X = 7) + P (X = 8) + P (X = 9) = 30
36
F (10) = P (x ≤ 10) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
33
+P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) = 36
F (11) = P (x ≤ 11) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
35
+P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) + P (X = 11) = 36
F (12) = P (x ≤ 12) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6)
+P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) + P (X = 11) + P (X = 12)
= 36
= 1.
36

F (9)

5.2

Nilai Harapan Variabel Random Diskrit

Nilai harapan suatu variabel random menggambarkan nilai yang diharapkan akan
terjadi dari suatu eksperimen random atau kecenderungan hasil yang akan terjadi.
Definisi 5.2.1. Nilai harapan suatu variabel random diskrit ditulis E(X) atau µ,
didefinisikan sebagai berikut
X
µ = E(X) =
xi .P (X = xi ),
Contoh 45. Pada percobaan melontarkan dua mata uang logam sebanyak satu kali
(Contoh 38), diperoleh

1
1
P (X = 1) =
4
2
Dengan demikian nilai harapannya adalah
P (X = 0) =

1
dan P (X = 2) = .
4

µ = E(X) = 0 · P (X = 0) + 1 · P (X = 1) + 2 · P (X = 2)
= 0 · 14 + 1 · 21 + 2 · 41 = 1.

42

BAB 5. VARIABEL RANDOM

Karena µ adalah nilai harapan variabel random X, maka X − µ merupakan
deviasi X terhadap nilai harapannya. Ukuran yang menggambarkan variabilitas
suatu variabel random didefinisikan berikut.

Definisi 5.2.2. Varian variabel random diskrit X ditulis V ar(X) atau σ 2 adalah

σ 2 = V ar(X) = E((X − µ)2 ) =

Kuantitas σ =



X

(xi − µ)2 .P (X = xi ),

σ 2 dinamakan deviasi standar.

Berdasarkan definisi di atas, V ar(X) merupakan nilai harapan kuadrat deviasi
X−µ; dengan demikian V ar(X) ≥ 0. Semakin besar varian suatu variabel random,
semakin basar variabilitasnya. Nilai varian suatu variabel random adalah 0 jika
dan hanya jika variabel random tersebut nilainya tetap. tersebut

Contoh 46. Varian pada Contoh 38 di atas adalah

σ 2 = V ar(X) = (0 − 1)2 .P (X = 0) + (1 − 1)2 .P (X = 1) + (2 − 1)2 .P (X = 2)
= 41 + 0 + 2. 14 = 0.5.

Deviasi standarnya adalah σ =



0.5 = 0.7.

43

5.3. VARIABEL RANDOM KONTINU

5.3

Variabel Random Kontinu

Jika X adalah variabel random dengan peluang pada setiap titik tunggal x sama
dengan nol, yakni P (X = x) = 0, maka X dinamakan variabel random kontinyu. Jika X variabel random kontinyu, maka ada fungsi f (x) sehingga peluang
variabel random X berada di antara a dan b sama dengan luas daerah yang dibatasi oleh kurva f (x), sumbu x, garis x = a dan garis x = b. Selanjutnya peluang
X berada di antara a dan b ditulis P (a < X < b). Fungsi f (x) tersebut dinamakan
fungsi kepadatan peluang.
Fungsi distribusi kumulatif variabel random kontinyu X, ditulis F (x), didefinisikan sebagai peluang variabel random X bernilai lebih kecil atau sama dengan x
atau
F (x) = P (X < x)
Contoh 47. Diketahui variabel random kontinyu X memiliki fungsi densitas f (x) =
1
dengan 0 ≤ x ≤ 5. Peluang variabel random X berada antara 1 dan 3 adalah
5
2
P (1 ≤ X ≤ 3) = ,
5
dan distribusi kumulatif di x = 2.5 adalah
1
F (2.5) = .
2

5.4

Variabel Random Bersama

Di dalam suatu penelitian, kita sering tertarik pada dua variabel random atau
lebih. Misalnya dalam meneliti tentang penyakit jantung, mungkin kita tertarik
pada beberapa faktor penyebab seperti kebiasaan merokok dan konsumsi alkohol.
Diketahui dua variabel random X dan Y . Untuk menggabungkan kedua variabel
dapat kita gunakan fungsi distribusi kumulatif.
Definisi 5.4.1. Diketahui variabel random X dan Y . Fungsi distribusi kumulatif bersama F (x, y) adalah
F (x, y) = P (X ≤ x, Y ≤ y).
Berdasarkan definisi di atas, fungsi distribusi kumulatif bersama adalah peluang
variabel random X ≤ x dan Y ≤ y terjadi bersama-sama.

44

BAB 5. VARIABEL RANDOM

Diketahui X dan Y masing-masing variabel random disktrit. Peluang variabel
random X bernilai x dan variabel random Y bernilai y ditulis P (X = x, Y = y).
Variabel random X dan Y dikatakan independen jika berlaku
P (X = x, Y = y) = P (X = x).P (Y = y)
Dua variabel random kontinyu X dan Y dikatakan independent jika peluang
terjadinya X tidak dipengaruhi apakah variabel random Y terjadi atau tidak. Jika
f (x, y) fungsi densitas variabel random kontinyu X dan Y dan kedua variabel
random independen, maka berlaku
f (x, y) = f1 (x).f2 (y),
dimana f1 (x) dan f2 (y) berturut-turut fungsi densitas X dan Y .

Bab 6

Beberapa Distribusi Peluang
Pada bagian ini akan disampaikan beberapa distribusi peluang var