Statistik Deskriptive - Repository UNIKOM
STATISTIK DESKRIPTIF
(Bab IV)
PENGERTIAN STATISTIK
DESKRIPTIfStatistik yang berfungsi untuk mendeskripsikan
atau memberi gambaran terhadap obyek yang
diteliti melalui data sampel atau populasi, tanpa
membuat kesimpulan yang berlaku umum.
Tendensi Central (letak data)
Sebaran frekuensi yang terpola di
sekitar nilai yang disebut nilai sentral, yaitu nilai: MeanUKURAN KECENDERUNGAN TENGAH ( TENDENCY CENTRAL) Tingkat Mode Median Mean Ukuran Interval
X X
X Ordinal
X X
KURVE SIMETRIS
- Apabila dilipat tepat di tengah-tengahnya maka setengah lipatan bagian kiri akan menutup tepat setengah lipatan bagian
KEMENCENGAN (SKEWNESS)
GRAFIK POLIGON
Condong kanan (pos) Condong kiri Neg
POLYGON SIMETRIS
Mean POLYGON CONDONG KEKANAN (Juling Positif)
N S
- - E
I
KURTOSIS (KELANCIPAN) f Fariasi Sangat rendah
Variasi Sangat besar
BEL NORMAL/ NORMAL
f
BEL LANGSING/ LEPTOKURTIK
f
BEL GEMUK/ PLATKURTIK
f
UKURAN DISPERSI
MERUPAKAN SUATU METODE ANALISIS YANG DITUJUKAN UNTUK MENGUKUR BESARNYA PENYIMPANGAN / PENYEBARAN DARI DISTRIBUSI DATA YANG DIPEROLEH TERHADAP
Contoh penggunaan DISPERSI :
DAPAT DIGUNAKAN SEBAGAI PENGUKUR KUALITAS (QUALITY CONTROL) DARI PRODUK YANG DIHASILKAN
CONTOH :
- PT INDOCEMENT YANG SETIAP HARINYA MENGHASILKAN RATA – RATA 500.000 ZAK SEMEN @ 40 KG TIAP ZAKNYA
- UNTUK MELIHAT PENYIMPANGAN
SAMPEL BERAT/KG KETERANGAN
1
40 KG
2
40 KG TIDAK
3
40 KG TERJADI PENYIMPANG
5
40 KG AN - 40 KG KESIMPULAN
- MESIN MASIH
BEKERJA DENGAN BAIK.
- KARENA RATA-
RATA BERAT ZAKNYA SESUAI DENGAN
5
SAMPEL BERAT/KG KETERANGAN 1 42,1 TERJADI PENYIMPANG AN 2 36,8 3 40,2
42 -
- - Contoh terjadi dispersi
1. ADA MESIN YANG BEKERJA TIDAK BAIK.
2. ARTINYA PERLU MENGECEK KEMBALI MESIN- MESIN YANG DIGUNAKAN
MACAM-MACAM UKURAN
DISPERSI :
1. RANGE (JANGKAUAN)/ RENTANGAN
2. DEVIASI RATA-RATA (AVERATE DEVIATION) DAN MEAN DEVIATION
3. DEVIASI STANDARD (STANDARD DEVIATION) DAN VARIANCE
RANGE
- RELATIF KASAR
- RANGE KECIL, BERARTI BAHWA SUATU DISTRIBUSI MEMILIKI
RANGKAIAN
CONTOH : (1)
KEUNTUNGAN YANG DIPEROLEH 8 TOKO
KELONTONG DI JALAN SOLOTOKO KEUNTUNGAN (Rp) A 4000 B 5000 C 6000 D 5000 E 4000
VARIASI RELATIF KECIL
(HOMOGEN) TOKO KEUNTUN GAN (Rp) A 4000 B 5000 C 6000 D 5000 E 4000 F 6000 G 5500 H 4500
VARIASI RELATIF KECIL (HOMOGEN)
DARI DATA DIATAS RATA-RATA
KEUNTUNGAN :
4 . 000 5 . 000 6 . 000 5 . 000 4 . 000 6 . 000 5 . 500 4 . 500 X
8
CONTOH : (2)
KEUNTUNGAN YANG DIPEROLEH 8 TOKO
KELONTONG DI JALAN SEMARANGTOKO KEUNTUNGAN (Rp) A 1.000 B 9.000 C 5.000 D 4.000 E 6.000
DARI DATA DIATAS RATA-
RATA KEUNTUNGAN :
RATA KEUNTUNGAN :
8 . 500 500 . 9 000
. 5 000 . 6 000 . 4 000 . 5 000
. 9 000
1
X 000 .
5
X
VARIASI RELATIF BESAR (HETEROGEN)
Frek
RATA-RATA 000 .
5
N fx x
PERBANDINGAN
PERBANDINGAN
- KEDUA CONTOH TERSEBUT DIATAS RATA-RATA SAMA = 5.000 TETAPI KEDUA TOKO TERSEBUT
- MEMILIKI PERBEDAAN DALAM PENYEBARANNYA CONTOH (1) RANGE = KECIL = >6.000-4.000 = 2.000 (HOMOGEN) CONTOH (2) RANGE = BESAR =
KESIMPULAN KESIMPULAN
- RANGE SEMAKIN
RENDAH SEMAKIN HOMOGEN
MEAN DEVIATION (DISEBUT DEVIASI RATA-RATA/ AVERAGE DEVIATION)
- MERUPAKAN PENYEBARAN
DATA ATAU ANGKA-ANGKA ATAS DASAR JARAK (DEVIASI) DARI PELBAGAI ANGKA-
RUMUS :
DATA TIDAK BERKELOMPOK
NX Xi MD N i
1
CONTOH :
KEUNTUNGAN YANG DIPEROLEH 5 TOKO
KELONTONGTOKO KEUNTUNGAN (Rp) A 4.000 B 5.000 C 6.000 D 5.000 E 5.000
N
X Xi MD N i
1 Xi X bar4.000 5.000 1.000 5.000 5.000 6.000 5.000 1.000 5.000 5.000
) (
X Xi
N
X Xi MD N i
1 2.000
= 2000/5 = 400
Standar Deviasi N x x
SD i
2 ) ( Varians
2 SD Varians Are You Ready ! Buka mulai dari hal IV-1 !!
Mari kita bahas tiap segmen dibawah
ini- OLAP Cubes Case Summaries Frekwencies
OLAP Cubes
Menu ini digunakan untuk meringkas data kuantitatif
atau data kualitatif secara praktis, yang mencakup banyak variabel, namun tidak dilakukan inferensi(analisis keputusan) terhadap data melainkan hanya
penggambaran/deskripsi saja.Contoh: Pada kasus yang sama (file berat responden) kita ingin melihat tinggi badan seseorang berdasarkan
Hasil OLAP Cubes
Simulasi 1 Cari deskripsi data dari:
- Jenis kelamin pria;jabatan midle management, tentukan mean dan median serta analisis kemungkinan bentuk kurva normalnya!
- Jenis kelamin wanita jabatan Low manajemen, tentukan mean dan median serta analisis kemungkinan bentuk kurva normalnya!
- Dari dua permasalahan diatas berapa nilai range masing-masing, serta analisis bentuk kurva normalnya (mana yg relative homogen dsn heterogen)
Case Summaries
Menyajikan ringkasan suatu variabel (data
kuantitatif atau kualitatif) dengan tampilan setiap kasus dengan criteria tertentu Contoh: Membuat case summaries dari variabel Hasil Case Summaries
Simulasi
(untuk berat/tinggi badan)
- Bandingkan nilai mean dan median setiap klasifikasi gender, kemudian
apakah data tersebar pada nilai besar
atau kecil • Bandingkan nilai skewnessnya, apakah
termasuk kurva positif atau sebaliknya
- Bandingkan nilai kurtosisnya, apakah
Frequencies
Digunakan untuk membuat table distribusi
frekuensi, dan menghitung nilai – nilai seperti mean, median, modus dan juga nilai tendensi sentral (kecenderungan terpusat).Contoh: Membuat table frekuensi dan
Hasil Frequencies
• N adalah jumlah data yang valid adalah
20 buah- Mean atau rata-rata tinggi responden adalah 166,29 cm dengan standar error sebesar 2,84 cm;
• Hal ini bisa ditafsirkan rentang rata-rata
tinggi karyawan terletak pada 3 standar 174.81 Batas atas rentang rata-rata usia error of mean ; yaitu: 166,29 cm +/- (3 x 2,84 cm) Rentang rata-rata usia 166.29
Median sebesar 165,55 cm Median = Persentil 50 menunjukan bahwa 50% tinggi responden adalah diatas dan dibawah 165,55 cm
Standar deviasi adalah 12,69 cm Varians
= Kuadrat dari standar deviasi bernilai 161,15
Hal ini menunjukan tinggi karyawan
terletak tiga standar deviasi yaitu
166,29 cm +/- (3 x 12,69cm)204.33 Batas atas rentang tinggi
Skewness
Ukuran skewness/kemencengan terhadap bentuk
normal adalah 0,134; teori menyebutkan jika skewness bernilai positif makamaka bentuk kurva positif dan data lebih tersebar
pada kurva sebelah kanan ; skewness bernilai negative sebaliknyaMed=165 Mo=
Kurtosis teori:
- Jika nilai nilai kurtosis sama dengan
3 maka dikatakan kurva normal (mesokurtik)
•Jika > 3 dikatakan kurva diatas kurva normal (leptokurtic)
- Jika
< 3 dikatakan kurva dibawah kurva normal (platikurtik).
Leptokurtik Mesokurtik
Platikurtik
Hasil Kortusis
Ukuran kurtosis/penyebaran terhadap distribusi
normal bernilai -0,795 maka Jika -0,795 < 3 maka dikatakan kurva dibawah kurva normal (platikurtik).Platikurtik Gambaran Kurva
- Platikurtik
Range adalah data maksimum dikurangi data minimum adalah 44,66 cm
Angka Persentil mengandung arti;
- 10% rata-rata tinggi
dibawah 146,54 cm
- 25% rata-rata tinggi
dibawah 155,58 cm
- 50% persentil adalah nilai median;
- 75% rata-rata tinggi
dibawah 175,25 cm
- 90% rata-rata tinggi
dibawah 184,84 cm Simulasi 2
- Buat pembuktian kurva dengan pendekatan skewness dan kurtosis untuk data variabel tinggi (caranya: Pada gambar 4-6 aktifkan
histogram dan with normal curve )
Buat analisis model frekuensi untuk
DESCRIPTIVE
Memberikan gambaran tentang suatu
data baik itu data kualitatif ataupun data
kuantitatif seperti mean, standar
deviasi, varians dan sebagainya .
CONTOH
• Buat deskripsi data variabel tinggi !
- Buat deskripsi data variabel berat!
• Untuk hasil variabel berat, apakah
data dapat dikatakan normal atau apakah ada data yang terlalu jauh (outlier atau exstrim) dari nilai
Z Scores
• Melihat nilai mana saja yang menyimpang jauh
(outlier) dari nilai mean• Pada Tab-Sheet data view muncul variabel baru
dengan nama Zberat;• Untuk data normal nilai Z akan terletak antara -
1,96 dan 1,96 pada taraf signifikan 5% dan tingkat kepercayaan 95%;
- Maka jika kita melihat data Zberat responden
akan terlihat adanya data outlier untuk nama
EXPLORE Melakukan deskripsi data dan
mengujinya; data yang digunakan bisa
berupa data kuantitatif dan atau data kualitatif.
Output test of normality
- Konsepnya nilai sig./signifikansi atau
probalitas < 0,05 distribusi adalah tidak normal dan sebaliknya;
- Seperti untuk pengujian kolmogorov smirnov pada jabatan low manajemen mempunyai nilai signifikan sebesar 0.200 (
> 0.05) yang menyatakan bahwa distribusi data normal
Simulasi 3
(Kasus data soal ganjil)
• Tentukan variabel tinggi sebagai objek data!!!
- Berapa nilai mean;modus;median?
- Berapa nilai standar error of mean dan Standar deviasi?
- Berapa nilai Persentil 25; 50; dan 95
- Apa arti persentil 95
- Apa hubungan antara median dengan persentil 50
- Berapa Rentang Rata-rata kasus tersebut,
lanjutan1
- Teori menyebutkan bahwa kurva normal
jika kisaran nilai mean=modus=median;
bentuklah kurva normal tersebut secara
skematis! - Berapa nilai skewness nya, bagaimana kemungkinan bentuk kurvanya, serta dimana kemungkinan posisi nilai mean, median modus?
- Berapa nilai kurtosisnya!, bagaimana
Lanjutan2
• Apakah dari kasus tersebut ada data
yang extrim (diluarbatas/outlier)- Jika ada data yang “outlier”, apa yang harus kita lakukan!
Jika data outier dihilangkan, jawab pertanyaan point pertama sampai
Lnjutan 3
- Dari hasil lanjutan 2 apakah data terdistribusi normal? Gunakana nilai signifikansi dengan kolmogorov smirnov !!!!!
Terimaksih