Slide INF107 Pertemuan 1

STATISTIKA DAN
PROBABILITAS

PERTEMUAN KE 1
SAFITRI JAYA, S.Kom, M.T.I
SEMESTER GANJIL TA 2017/2
UNIVERSITAS PEMBANGUNAN

KURIKULUM TEKNIK
INFORMATIKA UPJ
DISTRIBUSI MATA KULIAH
SEMESTER 1
NO KODE MK

NAMA MK

SKS

SIFAT

1


GNR101

BAHASA INDONESIA

2

MKU

2

GNR103

BAHASA INGGRIS

2

MKU

3


GNR105

DASAR LOGIKA MATEMATIKA

3

MKU

4

INF101

ALGORITMA PEMROGRAMAN

3

MKMA

5


INF103

PEMROGRAMAN BERORIENTASI OBJEK

3

MKMI

6

INF105

ALJABAR LINEAR

3

MKMI

7


INF107

STATISTIKA DAN PROBABILITAS

3

MKMI

KONTRAK PERKULIAHAN


SKS MK



LAMA PERKULIAHAN




JUMLAH TM



PELAKSANAAN UTS
: 16 – 20 OKTOBER 2017 (16 OKTOBER 2017)
PELAKSANAAN UAS
: 18 – 22 DESEMBER 2017 (18 DESEMBER 2017)
JADWAL KULIAH
: SENIN, PKL 12.50 – 15.20 WIB, R-614
TOLERANSI KETERLAMBATAN : 15 MENIT, > 15 MENIT ABSEN NIHIL
SYARAT IKUT UJIAN
: ABSENSI MINIMAL 70 % (4X ABSEN)
PENILAIAN
: 10% ABSENSI, 20% LATIHAN DI LOG BOOK, 35% UTS, 35% UAS
ALAT KOMUNIKASI
: SILENT/MODE GETAR SELAMA PERKULIAHAN BERLANGSUNG
KEWAJIBAN ALAT BM
: LOG BOOK, BUKU AJAR (PERKELOMPOK, STATISTIKA
PROBABILITAS, SUDARYONO, ILMU STATISTIKA ACHMAD

ZANBAR SOLEH)
EMAIL
: SAFITRI.JAYA@UPJ.AC.ID











: 3 SKS (2 SKS TEORI + 1 SKS LATIHAN)

: 100 MENIT TEORI + 50 MENIT LATIHAN
: 14 PERTEMUAN (7 SEBELUM UTS DAN 7 SETELAH UTS)

MATERI PERKULIAHAN

1. STATISTIKA DESKRIPTIF
2. PELUANG
3. DISTRIBUSI PROBABILITAS DISKRET
4. STATISTIKA INFERENSI
5. REGRESI LINEAR SEDERHANA
6. DISTRIBUSI SAMPLING

7. PENDUGAAN PARAMETER
8. ANALISIS VARIANSI SATU PIHAK ( ONE WAY)
9. HUBUNGAN STATISTIKA DUA PEUBAH
10.PENGUJIAN HIPOTESIS

STATISTIKA DESKRIPTIF
Statistika merupakan suatu cabang ilmu pengetahuan yang
bertujuan untuk mempelajari tata cara pengumpulan data
(sampling), pengolahan data, penyajian data, analisis data, dan
pengambilan keputusan berdasarkan data.
Penjabaran metodologi statistik didasarkan pada tiga hal :
1. Proses analisis
Analis deskriptif

Informasi diberikan secara visual dan bersifat subjektif dalam pembuatan
analisisnya.
 Analis konfirmatif (inferensi)


Informasi lebih bersifat objektif terutama dalam proses pengambilan
keputusan yang ditunjang dengan adanya nilai tingkat kesalahan pengukuran

STATISTIKA DESKRIPTIF
Penjabaran metodologi statistik didasarkan pada tiga hal :
2.

Asumsi bentuk distribusi
 Statistik Parametrik
Variabel yang menjadi input memiliki bentuk distribusi tertentu
 Statistik Non Parametrik
Variabel yang menjadi input tidak memiliki asumsi bentuk distribusi

3.


Banyaknya variabel yang dilibatkan
 Multi-variate
melibatkan banyak variabel
 Uni-variate & bi-variate
hanya melibatkan 1 atau 2 variabel

DATA
Menurut Webster’s New World Dictionary, Data diartikan sebagai sesuatu
yang diketahui atau diasumsikan. Menurut referensi lainnya mengatakan
bahwa data adalah sumber informasi yang diketahui/dicari/diasumsikan
untuk memberikan gambaran mengenai suatu keadaan atau persoalan.
Syarat untuk memperoleh data dengan kriteria “baik” :
1. Data harus objektif (data harus sesuai dengan keadaan yang sebenarnya);
2. Data harus representatif (data harus mewakili objek yang diamati);
3. Data harus memiliki standard error yang kecil (data harus memiliki tingkat
ketelitian yang tinggi);
4. Data harus relevan (data harus memiliki hubungan atau keterkaitan
dengan masalah yang akan diselesaikan).

DATA

Beberapa istilah penting yang terkait dengan proses pengumpulan
data :
1. Populasi merupakan himpunan atau kumpulan dari semua objek
yang diamati;
2. Sampel merupakan himpunan bagian dari populasi;
3. Sensus merupakan cara pengumpulan data dimana seluruh
elemen populasi diamati satu per satu (banyak data sama
dengan banyaknya anggota populasi);
4. Sampling merupakan cara pengumpulan data dimana yang
diselidiki adalah elemen sampel dari suatu populasi;
5. Paramater merupakan suatu besaran yang nilainya menyatakan

PENGELOMPOKAN DATA
populasi

sampel

data

Sifat


Sumber

Cara
memperole
h

Cara
mengumpu
lkan

Kualitatif

Internal

Primer

Cross
section

Kuantitatif

Eksternal

Sekunder

Time series

UKURAN PEMUSATAN DATA
1. Modus merupakan data yang memiliki frekuensi maksimum
2. Mean atau rata-rata
3. Median (simbol : Md, Quartil ke-2 [Q2] atau M)
M = Data terurut ke (n+1) / 2
4. Tri rata (simbol : TRI)
TRI = 0.25 (quartil bawah + 2 median + quartil atas)
5. Rata-rata antarkuartil (simbol : RAK)

CONTOH SOAL
Seorang mahasiswa planologi diberikan tugas yaitu mengamati besarnya dana
yang digunakan oleh 12 kota di Pulau Jawa dalam menata kawasan kumuh.
Mahasiswa tersebut mendatangi kantor dinas tata kota di ke 12 kota dan
memperoleh
informasi
sebagai berikut : Simbol data mentah
Nama Kota
Dana (satuan : Rp Milyar)
Simbol data
terurut
A

113, 75

X1

[ X9 ]

B

99, 59

X2

[ X3 ]

C

111, 79

X3

[ X7 ]

D

300, 78

X4

[ X12 ]

E

101, 66

X5

[ X5 ]

F

124, 13

X6

[ X10 ]

G

90, 00

X7

[ X2 ]

H

20, 19

X8

[ X1 ]

I

99, 92

X9

[ X4 ]

J

112, 49

X10

[ X8 ]

K

135, 72

X11

[ X11 ]

L

102, 09

X12

[ X6 ]

PENYELESAIAN : UKURAN
PEMUSATAN DATA

1. Modus = 0

2. Mean = (1/12)(1412,11) = 117,68
3. Median = data terurut ke (12+1)/2
= data terurut ke 6,5
= x[6,5]
= x[6] + 0,5 {x7 – x6}
= 102,09 + 0,5 {111,79 – 102,09}
= 106,94
4. Quartil Atas (QA) = data terurut ke (12+1) (3/4)
= data terurut ke 9,75
= x[9,75]
= x[9] + 0,75 {x10 – x9} = 121,54
5. Quartil Bawah (QB) = data terurut ke (12+1) (1/4)
= data terurut ke 3,25
= x[3,25]
= x[3] + 0,25 {x4 – x3} = 99,84
6. TRI Rata = 0,25 {QB + 2 M + QA}
= 0,25 {99,84 + 2(106,94) + 121,54
= 108,81
7. Rata-rata antar quartil (RAK)
Ada 3 data yang terletak diantara QA dan QB, yaitu
m=3
RAK = (102,09 + 101,66 + 99,92) / 3 = 101, 22

102,09

101,66

99,92

UKURAN PENYEBARAN DATA
1. Rentang data / Range (simbol : R)
R = Nilai data terbesar – Nilai data terkecil
2. Sebaran tengah / Deviasi antar kuartil (simbol : dq)
dq = QA – QB
3. Deviasi rata-rata (simbol : d)
4. Variansi (simbol : s2) dan simpangan baku (simbol : s)
5. Koefisien variansi (simbol : CV)
CV = s / mean

PENYELESAIAN : UKURAN
PENYEBARAN DATA
1. Rentang data

  R = 300,78 – 20,19
= 280,59

2. Sebaran tengah
dq = QA – QB
= 121,54 – 99,84
= 21,7
3. Deviasi rata-rata
d = / 12
= 385,21 / 12 = 32,101
4. Variansi dan simpangan baku
s2 = 1/(n-1) [ - { n]
= 4125,688
s =variansi = 64,232
5. Koefisien variansi
CV = s / mean
= 64,232 / 117,68
= 0,55

BENTUK DISTRIBUSI
Distribusi merupakan pola atau model yang merupakan gambaran
kondisi sekelompok data.

Simetris

Menjurai ke kanan

Menjurai ke
kiri

DIAGRAM BATANG DAUN
(STEAM LEAF )
Prinsip dari steam leaf adalah memanfaatkan nilai data untuk
melihat distribusi data. Adapun langkah-langkah membuat steam
leaf adalah sebagai berikut :
1. Tentukan data yang memiliki nilai terbesar dan nilai terkecil;
2. Gunakan nilai data terbesar dan terkecil sebagai patokan
penentuan dari batang. Misalkan data terbesar adalah 76 dan
terkecil adalah 6, maka satuan batang yang dapat dipilih adalah
puluhan;
3. Tentukan satuan daun. Karena satuan batang adalah puluhan,
maka satuan daun harus lebih kecil dari satuan batang (satuan,
persepuluhan, perseratusan, dst);

PENYELESAIAN DIAGRAM
BATANG
DAUN
1. Nilai terbesar = 300,78 dan nilai terkecil = 20,19;
2. Satuan batang berdasarkan nilai terbesar adalah ratusan dan
puluhan;
3. Satuan daun adalah satuan, sepersepuluh, seperseratus;
30
078
4. Batang
Daun
....

....

....

....

13

572

12

413

11

375; 179;
249

....

....

2

DIAGRAM KOTAK ( BOX PLOT)
Prinsip dari box plot adalah membagi data menjadi empat
kelompok berbeda yang dibatasi oleh QA, QB, dan M. Adapun
langkah-langkahnya adalah sebagai berikut :
1. Tentukan nilai terbesar dan nilai terkecil;
2. Hitung nilai QA, QB dan M dari data;
3. Gambarkan box plot sebagai berikut :

X
min

QB

Media
n

QA

X
max

PENYELESAIAN DIAGRAM
KOTAK (BOX PLOT)
Penyelesaian masalah adalah sebagai berikut :
1. Nilai terbesar adalah 300,78 dan nilai terkecil adalah 20,19;
2. QA = 121, 54

QB = 99,84

Median = 106,94;

3. Gambar box plot adalah sebagai berikut

20,19

99,8
4

106,9
4

121,5
4

Kesimpulan :
Karena data mengumpul di
nilai-nilai kecil dan
menyebar di nilai besar,
maka bentuk distribusinya
adalah menceng ke kiri
atau menjurai ke kanan.
300,7
8

MEMBANDINGKAN MEAN
DAN MEDIAN
Cara yang sangat mudah dan cepat dalam menyimpulkan bentuk
distribusi adalah dengan cara membandingkan nilai mean dan
median. Hasil yang dapat diperoleh diantaranya :
1. Distribusi Simetris jika nilai mean = nilai median;
2. Distribusi menceng ke kiri atau menjurai ke kanan jika median <
rata-rata;
3. Distribusi menceng ke kanan atau menjurai ke kiri jika median >
rata-rata;

PENYELESAIAN MEMBANDINGKAN
MEAN DAN MEDIAN
Mean = 117,68
Median = 106,94
Hasil = Median < Mean, maka
Distribusi menceng ke kiri atau menjurai ke kanan jika median <
rata-rata

PENCILAN
Pencilan (outlier) memberikan informasi mengenai data yang
harganya jauh berbeda dari nilai data lainnya.
Mendeteksi data yang masuk pencilan sangat penting dalam
statistika, karena data tersebut dapat mengganggu hasil analisis
data. Oleh karena itu, data pencilan harus dianalisis tersendiri dan
terpisah dari kelompoknya. Langkah-langkah mendeteksi pencilan
adalah sebagai berikut :
1. Hitung besar nilai sebaran tengah, dq = QA – QB;
2. Hitung nilai batas bawah pencilan (BPP) = QB – [1,5 x dq];
3. Hitung nilai batas atas pencilan (BAP) = QA + [1,5 x dq];
4. Analisis data pencilan.

PENYELESAIAN PENCILAN
1. Sebaran tengah dq = QA – QB = 121,54 – 99,84 = 21,7;
2. BPP = QB – [1,5 x dq] = 67,29;
3. BAP = QA + [1,5 x dq] = 154,09;
4. Terdapat satu data yang nilainya dibawah nilai BPP yaitu 20,19,
hal ini berarti terdapat satu pencilan bawah yaitu data dengan
nilai 20,19.
Terdapat satu data yang nilainya diatas nilai BAP yaitu 300,78,
hal ini berarti
terdapat satu pencilan atas yaitu data dengan
nilai 300,78.