1. STATISTIK PENDAHULUAN_DINA.docx
TUGAS MATEMATIKA TERAPAN
Ir. H. Sumirin, MS
TUGAS 1
ISTILAH-ISTILAH DALAM STATISTIK
Disusun Oleh :
DYAN RADITYO, ST
MTS 13.25.1.0611 S
MANAJEMEN REKAYASA KONSTRUKSI
PROGRAM PASCASARJANA
MAGISTER TEKNIK SIPIL
UNIVERSITAS SULTAN AGUNG
2013
1. STATISTIK
Statistik (statistic) adalah bilangan /ukuran-ukuran tertentu yang diperoleh melalui proses perhitungan terhadap sekumpulan data yang berasal dari sampel. Statistika (statistics) adalah konsep dan metode yang bisa digunakan untuk mengumpulkan, menyajikan, dan menginterpretasikan data dari kejadian tertentu untuk mengambil suatu keputusan/kesimpulan dalam suatu kondisi adanya ketidakpastian Statistika banyak diterapkan dalam berbagai disiplin ilmu, baik ilmu-ilmu alam (misalnya Statistika juga digunakan dalammerupakan salah satu prosedur yang paling dikenal. Aplikasi statistika lainnya yang sekarang popular adalah prosedurrhitungan cepat hasil pemilu) atau quick count. Di bidang komputasi, statistika dapat pula diterapkan dalam Penggunaan istilah statistika berakar dari istilah istilah dalam bahasa latin modern statisticum collegium ("dewan negara") dan bahasa Italia statista ("negarawan" atau "politikus"). untuk pertama kalinya sebagai nama bagi kegiatan analisis data kenegaraan, dengan mengartikannya sebagai "ilmu tentang negara (state)". Pada awaltelah terjadi pergeseran arti menjadi "ilmu mengenai pengumpulan dan klasifikasi data". Sir John Sinclair memperkenalkan nama (Statistics) dan pengertian ini ke dalam Jadi, statistika secara prinsip mula-mula hanya mengurus data yang dipakai lembaga-lembaga administratif dan pemerintahan. Pengumpulan data terus berlanjut, khususnya melaluiyang dilakukan secara teratur untuk memberi informasi kependudukan yang berubah setiap saat. Pada abad ke-19 dan awal abad ke-20 statistika mulai banyak menggunakan bidang-bidang dalam Cabang statistika yang pada saat ini sangat luas digunakan untuk mendukung(peletak dasar statistika inferensi),
Penggunaan statistika pada masa sekarang dapat dikatakan telah menyentuh semua bidang ilmu pengetahuan, mulai darin cabang-cabang terapannya, serta Akibatnya lahirlah ilmu-ilmu gabungan seperti Meskipun ada pihak yang menganggap statistika sebagai cabang dari matematika, tetapi sebagian pihak lainnya menganggap statistika sebagai bidang yang banyak terkait dengan matematika melihat dari sejarah dan aplikasinya. Di Indonesia, kajian statistika sebagian besar masuk dalam fakultas matematika dan baik di dalam departemen tersendiri maupun tergabung dengan matematika.
STATISTIKA : Konsep Statistika KEGUNAAN Kegiatan untuk : mengumpulkan data menyajikan data
Melalui fase ? menganalisis data dengan metode tertentu
STATISTIKA DESKRIPTIF : menginterpretasikan hasil analisis
Berkenaan dengan pengumpulan, pengolahan, dan penyajian sebagian
dan fase
atau seluruh data (pengamatan) tanpa pengambilan kesimpulan STATISTIKA INFERENSI : Setelah data dikumpulkan, maka dilakukan berbagai metode statistik untuk menganalisis data, dan kemudian dilakukan interpretasi serta diambil kesimpulan.
Statistika inferensi akan menghasilkan generalisasi (jika sampel representatif)
Statistika dan Metode Ilmiah METODE ILMIAH : Adalah salah satu cara mencari kebenaran
LANGKAH-LANGKAH DALAM METODE
yang bila ditinjau dari segi penerapannya,
ILMIAH : resiko untuk keliru paling kecil.
Merumuskan masalah Melakukan studi literatur Membuat dugaan-dugaan, pertanyaan-
INSTRUMEN SAMPEL pertanyaan atau hipotesis
JENIS DATA PERAN STATISTIKA
VARIABEL Mengumpulkan dan mengolah data,
METODE ANALISIS
menguji hipotesis, atau menjawab pertanyaan Mengambil kesimpulan 2.
VARIABEL Variabel : Adalah karakteristik dari obyek penelitian yang memiliki nilai bervariasi.
Misalnya,
jenis kelamin: laki-laki dan perempuan.
Status ekonomi: tinggi, sedang, rendah. Berat badan: 50 kg, 60 kg, 70 kg.
Variabel Bebas/Independent : Dalam hubungan antar dua atau lebih variabel, variabel
bebas merupakan variabel yang dapat mempengaruhi variabel lainnya. Misalnya; variabel X à variabel Y, menggambarkan variabel X mempengaruhi variabel Y, maka X disebut variabel bebas.
Variabel Tak Bebas/Dependent : Dalam hubungan antar dua atau lebih variabel, variabel tak
bebas merupakan variabel yang dipengaruhi oleh variabel lainnya. Misalnya; variabel X à variabel Y, menggambarkan variabel Y dipengaruhi oleh variabel X, maka Y disebut variabel tak bebas
3. MODEL
Adalah pendekatan bentuk polygon frekuensi dengan garis lengkung halus yang bentuknya secocok mungkin: a. Model normal
b. Model simetrik c. Model miring (ke kanan/ke kiri).
Jika suatu frekwensi tidak simetrik maka nilai mean (rata-rata) dan median tidak sama.
4. DATA
Data : Adalah fakta, atau angka atau segala sesuatu yang dapat dipercaya kebenarannya
sehingga dapat digunakan sebagai dasar menarik suatu kesimpulan Sumber data :
a) Data intern : Data yang bersumber dari dalam lembaga atau perusahaan itu sendiri
b) Data ekstern : Data yang diperoleh dari sumber2 di luar lembaga atau perusahaan Data ekstern dapat dibagi menjadi dua:
- Data primer : Data yang dikumpulkan dan diolah sendiri oleh orang atau organisasi yang menerbitkannya.
- Data sekuder : Data yang diterbitkan oleh organisasi yang bukan merupakan pengolahnya
Data Primer Wawancara langsung
DATA Wawancara tidak langsung
Data dari pihak lain: Pengisian kuisioner Data Sekunder BPS
Bank Indonesia World Bank, IMF FAO dll
Pengolahan Data MULAI NOMINAL
INTERVAL Statistik
Statistik
ORDINAL RASIO
Non Parametrik Parametrik
SATU DUA / LEBIH
Analisis Analisis Univariat MultivariatJ e n Ju i ml s ah
D
V a ar t ia a be ? l ?
5. SAMPEL
- Sampel : himpunan unit penelitian yang memberikan informasi atau data yang diperlukan dalam penelitian. Sampel merupakan himpunan bagian dari populasi. Misal : Sampelnya : Hanya petani tembakau yang terpilih untuk diteliti setelah melalui “proses sampling”.
- Sampling : Sampling adalah suatu proses memilih n buah obyek dari sebuah populasi berukuran N.
6. POPULASI Populasi adalah keseluruhan pengamatan yang menjadi perhatian kita baik yang berhingga
maupun tak berhingga jumlahnya. Seringkali tidak praktis mengambil data dari keseluruhan populasi untuk menarik suatu kesimpulan. Untuk itu dilakukan pengambilan sampel yaitu sebagian atau himpunan bagian dari populasi. Sampel yang diambil haris dapat merepresentasikan populasi yang ada. Prosedur pengambialan sampel yang menghasilkan kesimpulan yang konsisten terlalu tinggi atau terlalu rendah mengenai suatu ciri populasi dikatakan berbias. Untuk menghindari kemungkinan bias ini perlu dilakukan pengambian contoh acak atau contoh acak sederhana. Contoh acak sederhana didefinisikan sebagai contoh yang dipilih sedemikian rupa sehingga setiap himpunan bagian yang berukuran n dari populasi mempunyai peluang terpilih yang sama.
: himpunan yang lengkap dan sempurna dari semua unit penelitian.
- Populasi Misal : Penelitian tentang pendapatan petani tembakau di kabupaten X.
Populasi : Seluruh petani tembakau yang ada di kabupaten X,
- Populasi Sampel : Misal : Tempat penelitian : 3 kecamatan A, B, dan C di kabupaten X.
Populasi sampel : Petani tembakau yang ada di kecamatan A, B, dan C.
7. UJI HIPOTESIS
Hipotesis : uji signifikansi (keberartian) terhadap hipotesis yang dibuat ; berbentuk hipotesis penelitian dan hipotesis statistik (H0) ; hipotesis bisa terarah, bisa juga tidak terarah ; akibat dari adanya Ho, maka akan ada Ha (hipotesis alternatif) yakni hipotesis yang akan diterima seandainya Ho ditolak
DUA TIPE HIPOTESIS :
HIPOTESIS NOL (H0) YAITU HIPOTESIS YANG MENYATAKAN TIDAK ADANYA • HUBUNGAN ANTARA DUA VARIABEL / LEBIH ATAU TIDAK ADANYA PERBEDAAN ANTARA DUA KELOMPOK / LEBIH
HIPOTESIS ALTERNATIF (H1) YAITU HIPOTESIS YANG MENYATAKAN ADANYA • HUBUNGAN ANTARA DUA VARIABEL/LEBIH ATAU ADANYA PERBEDAAN ANTARA DUA KELOMPOK / LEBIH
Hipotesis : Uji statistika :
Ilustrasi
Contoh Uji Hipotesis : Seorang yang dituduh pencuri dihadapkan kepada seorang hakim. Seorang hakim akan menganggap orang tersebut tidak bersalah, sampai kesalahannya bisa dibuktikan. Seorang jaksa akan berusaha membuktikan kesalahan orang tersebut. Dalam kasus ini,
(H ) inilah yang akan
1 1 dibuktikan.
Ada dua kondisi yang mungkin terjadi terhadap orang tersebut: 1. Orang tersebut tidak bersalah.
2. Orang tersebut bersalah. Dan ada dua keputusan yang bisa diambil hakim 1. Melepaskan orang tersebut.
2. Memenjarakan orang tersebut.
Hipotesis nol (H ) benar (Orang tersebut tidak bersalah) Hipotesis alternatif (H
1 ) benar (Orang tersebut bersalah) Menerima hipotesis nol (Orang tersebut dibebaskan)
Keputusan yang benar Keputusan yang salah
(Kesalahan Tipe II)
Menolak hipotesis nol (Orang tersebut dipenjara)
Keputusan yang salah (Kesalahan Tipe I) Keputusan yang benar.
Dalam kasus ini, ada dua kemungkinan kesalahan yang dilakukan hakim
1. Memenjarakan orang yang benar (Kesalahan Tipe I)
2. Melepaskan orang yang bersalah (Kesalahan Tipe II) Ada banyak jenis uji hipotesis yang dikenal. Tabel berikut menjelaskan rumus untuk masing-masing uji hipotesis tersebut.
Nama Rumus Asumsi / Catatan
Satu sampel
(En=One-sample z-test) (Populasi normal atau n > 30) dan σ diketahui.
(z adalah jarak dari rata-rata sehubungan dengan
memungkinkan untuk dihitung proporsi terkecil dalam sebuahyang berada di dalam k simpangan baku untuk setiap k.
Dua sampel z- test Populasi normal dan observasi
(En=Two-sample independen dan σ dn σ diketahui
1
2
z-test) Satu sampel
(Populasi normal atau n > 30) dan (En=One-sample tidak diketahui t-test)
Pasangan t-test (Populasi normal dari
(En=Paired t- perbedaan atau n > 30) dan tidak test) diktahui
Dua sampel t-test digabung (Populasi
(En=Two-sample normal atau n
1 + n 2 > 40) dan observas
pooled t-test) i independen dan σ = σ idak
1
2 yang
diketahui sama Dua sampel t-test terpisah
(Populasi (En=Two-sample normal atau n + n > 40) dan observas
1
2
unpooled t-test) i independen dan kedua σ
1 ≠ tidak
σ diketahui
2
sama . Satu proporsi n p > 10 dan n (1 − p ) > 10.
(En=One- proportion z-test) Dua proporsi z- test
n 1 p 1 > 5 dan n 1 (1 − p 1 ) >
(En=Two- 5 dan n p > 5 dan n (1 − p ) >
2
2
2
2
proportion z-test) 5dan observasi independen. di gabungkan
Dua proporsi z- test
n p > 5 dan n (1 − p ) >
1
1
1
1
(En=Two- 5 dan n
2 p 2 > 5 dan n 2 (1 − p 2 ) >
proportion z- 5dan observasi independen. test) tid ak digabung Chi-squared test
Populasi normal untuk varians
df = k - 1 - # parameter terestimasi
- Semua jumlah yang diharapkan Chi-squared test
untuk goodness
- Semua jumlah yang diharapkan > 1 of fit
dan tidak lebih dari 20% dari jumlah
yang diharapkan lebih kecil dari Dua sampel
uk
Populasi normal persamaa
Diurutkan > dan H ditolak (En=Two-sample jika
F test for
equality of variances)
Definisi simbol:
, probabilitas melakukan =sampel = x/n = Proporsi kesalahan tipe I (menolak sampel, (kecuali
= Simpangan baku hipotesis nol pada saat hipotesis ditentukan sebelumnya) sampe 1 nol benar)
= Dugaan proporsi = Simpangan baku
= Jumlah sampel populasi sampe 2
= Jumlah sampel 1 = proporsi 1
= = Jumlah sampel 2
= proporsi 2 =
= Rata-rata sampel
n=Degree of
= Dugaan = Dugaan rata-rata freedom) perbedaan proporsi populasi = Rata-rata
= = Rata-rata populasi 1 perbedaan sampel minimum ofn and n
1
2
= Rata-rata populasi 2 = Dugaan rata-
= rata perbedaan populasi
populasi
= Simpangan baku
=populasi perbedaan =sampel
=
= Penjumlahan(dari angka sejumlak k)
8. KORELASI
Pedoman penafsiran koefisien korelasi Interval Koefisien Tingkat Hubungan 0,00 - 0,199 sangat rendah 0,20 - 0,399 rendah 0,40 - 0,599 Sedang 0,60 - 0,799 kuat 0,80 - 1,000 sangat kuat
Dua Macam uji Korelasi : Korelasi : hubungan keterkaitan antara dua atau lebih variabel.
Angka koefisien korelasi ( r ) bergerak -1 ≤ r ≤ +1 NOL tidak ada atau tidak menentunya hubungan dua variabel contoh : pandai matematika dan jago
olah raga ; pandai matematika dan tidak
bisa olah raga ; tidak pandai matematika
dan tidak bisa olah raga à korelasi nol antara matematika dengan olah ragaPOSITIF makin besar nilai variabel 1 menyebabkan makin besar pula nilai variabel 2 Contoh : makin banyak waktu belajar, makin tinggi skor Ulangan à korelasi positif antara waktu belajar dengan nilai ulangan
NEGATIF makin besar nilai variabel 1 menyebabkan makin kecil nilai variabel 2 contoh : makin banyak waktu bermain, makin kecil skor Ulangan à korelasi negatif antara waktu bermain dengan nilai ulangan a. KORELASI PEARSON : apakah di antara kedua variabel terdapat hubungan, dan jika ada hubungan bagaimana arah hubungan dan berapa besar hubungan tersebut. Digunakan jika data variabel kontinyu dan kuantitatif
b. KORELASI SPEARMAN (rho) dan Kendall (tau) : Digunakan jika data variabel
ordinal (berjenjang atau peringkat).
Disebut juga korelasi non parametrik Untuk mengetahui korelasi pada uji parametrik digunakan Koefisien Korelasi Pearson (r), dengan rumus sebagai berikut : Keterangan : n = banyaknya sampel X = variabel independen (prediktor) Y = variabel dependen (outcome) Nilai “r” berkisar antara 0.0 yang berarti tidak ada korelasi, sampai dengan 1.0 yang berarti adanya korelasi yang sempurna. Semakin kecil nilai “r” semakin lemah korelasi, sebaliknya semakin besar nilai “r” semakin kuat korelasi. Berikut pembagian kekuatan korelasi menurut Colton : r = 0,00 - 0,25 --> tidak ada hubungan/hubungan lemah r = 0,26 - 0,50 --> hubungan sedang r = 0,51 - 0,75 --> hubungan kuat r = 0,76 - 1,00 --> hubungan sangat kuat/sempurna
9. REGRESI Regresi linear bertujuan untuk memprediksi variabel dependen melalui variabel independen.
Untuk memprediksi digunakan persamaan garis regresi dengan metode Least Square :
Keterangan : Y = variabel Dependen X = variabel Independen a = Intercep b = Slope Dimana Slope :
- Intercep : Besarnya nilai Y, ketika X=0 *Slope : Besarnya perubahan nilai Y bila nilai X berubah setiap unitnya. Sebetulnya persamaan garis di atas merupakan model deterministik yang secara sempurna/tepat dapat digunakan hanya untuk peristiwa alam. Namun ketika kita berhadapan dengan kondisi ilmu sosial, ada kemungkinan terjadi kesalahan atau penyimpangan (tidak eksak) pada hubungan antara variabel, artinya untuk beberapa nilai X yang sama akan menghasilkan nilan Y yang berbeda. Sehingga persamaan garis yang dibentuk menjadi : e = nilai kesalahan (error) yaitu selisih anatara nilai Y individual teramati dengan nila Y yang sesungguhnya pad titik X tertentu.
10. UJI F
Tabel F dilakukan untuk mengetahui pengaruh variabel bebas secara bersama-sama terhadap variabel terikat.
Langkah-langkah/ urutan menguji hipotesa dengan distribusi F
a. Merumuskan hipotesa Ho : β = β = β = β = 0, berarti secara bersama-sama tidak ada pengaruh variabel bebas
1
2
3
4 terhadap variabel terikat. Ha : β 1 ≠ β 2 ≠ β 3 ≠ β 4 ≠ 0, berarti secara bersama-sama ada pengaruh variabel bebas terhadap variabel terikat.
b. Menentukan taraf nyata/ level of significance = α Taraf nyata / derajad keyakinan yang digunakan sebesar α = 1%, 5%, 10%. Derajat bebas (df) dalam distribusi F ada dua, yaitu : df numerator = dfn = df = k – 1
1 df denumerator = dfd = df 2 = n – k Dimana: df = degree of freedom/ derajad kebebasan n = Jumlah sampel k = banyaknya koefisien regresi
c. Menentukan daerah keputusan, yaitu daerah dimana hipotesa nol diterima atau tidak Ho diterima apabila F hitung ≤ F tabel, artinya semua variabel bebas secara bersama-sama bukan merupakan variabel penjelas yang signifikan terhadap variabel terikat. Ho ditolak apabila F hitung > F tabel, artinya semua variabel bebas secara bersama-sama merupakan penjelas yang signifikan terhadap variabel terikat.
d. Menentukan uji statistic nilai F Bentuk distribusi F selalu bernilai positif
e. Mengambil keputusan Keputusan bisa menolak Ho atau menolak Ho menerima Ha.
Nilai F tabel yang diperoleh dibanding dengan nilai F hitung apabila F hitung lebih besar dari F tabel, maka ditolak sehingga dapat disimpulkan bahwa ada pengaruh yang signifikan antara variabel independen dengan variabel dependen.
11. UJI T
Uji t : menguji apakah rata-rata suatu populasi sama dengan suatu harga tertentu atau apakah rata-rata dua populasi sama/berbeda secara signifikan.
a. Uji t satu sampel (Uji t Satu Sampel (One Sample t Test)
Menguji apakah satu sampel sama/berbeda dengan rata-rata populasinya
- hitung rata-rata dan std. dev (s)
- df = n – 1
( - ) t =
- tingkat signifikansi ( α = 0.025 atau 0.05)
s / √n
- pengujian apakah menggunakan 1 ekor atau 2 ekor
- diperoleh t hitung ; lalu bandingkan dengan t tabel : jika t hitung > t tabel Ho ditolak Contoh : Peneliti ingin mengetahui apakah karyawan yang bekerja selama 8 tahun memang berbeda dibandingkan dengan karyawan lainnya. Ho : p1 = p2 Diperoleh rata2 = 17.26 ; std. Dev = 7.6 ; df = 89 ; t hitung = 11.55 Berdasarkan tabel df=89 dan = 0.05 diperoleh t tabel = 1.987
Kesimpulan : t hitung > t tabel sehingga Ho ditolak karyawan yang bekerja selama 8 tahun secara signifikan berbeda dengan karyawan lainnya
b. Uji t dua sampel bebas
Menguji apakah rata-rata dua kelompok yang tidak berhubungan sama/berbeda
2
2 (Σx + Σy ) t =(X – Y)
Di mana Sx-y Sx (n + n
(1/n + 1/n ) x y x y
= √
- y
- – 2)
Contoh : Peneliti ingin mengetahi apakah ada perbedaan penghasilan dosen antara dosen yang lulusan S2 dengan yang lulusan S3 Ho : Pb = Pk
Diperoleh : rata2 x = 1951613 ; y = 2722222 ; t hitung = - 7.369 Berdasarkan tabel df=69 dan α = 0.025 diperoleh t tabel = 1.994 Kesimpulan : t hitung > t tabel sehingga Ho ditolak
Rata-rata penghasilan dosen yang S2 berbeda secara signifikan dengan penghasilan dosen yang S3
c. Uji t dua sampel berpasangan
Menguji apakah rata-rata dua sampel yang berpasangan sama/berbeda
Di mana D = rata-rata selisih skor pasangan t = Ds
2
2
2
2 ΣD – (ΣD) Σ d s N(N-1) Σ d =N
D D √
=
Contoh : Seorang dosen ingin mengetahui efektivitas model pembelajaran diskusi. Setelah selesai pembelajaran pertama, ia memberikan tes dan setelah selesai pembelajaran kedua kembali ia memberikan tes. Kedua hasil tes tersebut dibandingkan dengan harapan adanya perbedaan rata-rata tes pertama dengan kedua.
Ho : Nd = Nc Diperoleh rata2d = 66.28 ; rata2c = 73.84 ; t hitung = -8.904 Berdasarkan tabel df=163 dan α = 0.05 diperoleh t tabel = 1.960 Kesimpulan : t hitung > t tabel sehingga Ho ditolak
Terdapat perbedaan yang signifikan antara hasil tes pertama dengan hasil tes kedua, sehingga ia menyimpulkan model diskusi efektif meningkatkan hasil belajar mahasiswanya
SUMBER :