Kuliah 6 T test 2 sample Independent dependent
When to use the independent samples
t-test
Ujian t dua sampel tidak bersandar merupakan ujian statistik yang paling banyak digunakan. Ujian ini digunakan untuk membanding perbezaan min antara dua kumpulan tidak bersandar/berkaitan.
Contoh kumpulan yang dibina dengan mebahagikan
responden kepada dua kumpulan berbeza secara rawak
(intervensi & kawalan).Kumpulan ini juga boleh dibina memlaui perbezaan sedia
ada, cth jantina.
The Formula …
Distribution of Differences
between means
H : μ = μ
1
2 H : μ = μ
1
1
2 Variance Sum Law: The variance of the sum or
difference of two independent variables is equal to the sum of their variances.
The t statistic
Degrees of freedom (df)
df = (n – 1) + (n – 1)
1
2
Contoh 1
Kalau kita bahagikan dua kumpulan kepada 2 jenis diet yang berbeza:
diet nasi lemak diet teh tarik
Subjek dimasukkan secara rawak dalam kump diet nasi lemak dan kump teh tarik untuk satu minggu. Ini mungkin tidak beretika… kerana nasi lemak mestilah makan bersama teh tarik! Tetapi ini hanyalah contoh.
Example 1 (cont.)
Pada akhir minggu, kita mengukur perubahan berat badan. Diet yang mana menyebabkan peningkatan berat badan yang lebih? Maka, hipotesis nol ialah: Ho: wt. gain diet nasi lemak =wt. gain diet teh tarik
Imbas Kembali....
Kenapa kita menguji H ?
1. Tulis Hipotesis
2. Tetapkan alpha ( )
3. Buat pengiraan
4. Dapatkan critical value
5. Lakarkan kawasan penolakan hipotesis nol
6. Buat Keputusan dan tulis kesimpulan
Langkah 1: Hipotesis
H : μ = μ
nasi lemak teh tarik
H : μ ǂ μ
1 nasi lemak teh tarik
Boleh anda terangkan apakah yang dilambangkan oleh simbol μ yang ada dalam hipotesis di atas? Bolehkah anda tulis hipotesis statistik di atas dalam perkataan? Adakah ini ujian satu hujung atau dua hujung?
Langkah 2: tetapkan alpha
Apakah α? Nilai α yang diterima oleh ahli akademik dalam bidang sains social adalah 0.05.
Apakah masudnya α = 0.05?
Langkah 3: Pengiraan
Rumus untuk ujian t dua sampel tidak bersandar ialah:
Langkah 3: Pengiraan
Χ − Χ Χ − ΧΧ = Χ = Χ − Χ
∑ = = −
Langkah 3: Pengiraan
Rumus untuk ujian t dua sampel tidak bersandar ialah:
Langkah 3: Pengiraan
ApakahDaripada pengiraan tadi, kita sudah ada
maksudnya
semua maklumat yang diperlukan untuk
nilai
mengira “t.”
negatif ini? ! ! " # $ ! % & '
' % % & % &%
!% % % (Langkah 4: Dapatkan Nilai Kritikal
Rujuk kepada jadual nilai kritikal untuk taburan t Nilai kritikal untuk df = 8 untuk taburan t adalah: C.V. = 2.306.
t(8), 2-tailed
Langkah 5: Lakarkan kawasan
penolakan hipotesis nol
Langkah 6: Buat Keputusan
Berdasarkan lakaran kawasan penolakan hipotesis pada slide sebelum ini, buat keputusan jika hipotesis H ditolak atau tidak.
Terangkan keputusan anda.
The 95% Confidence Interval?
Pelaporan Dapatan Ujian
Nilai t yang dikira (-4.47) jatuh dalam kawasan
penolakan nul hipotesis (nilai kritikal 2.306), maka H
ditolak.Responden dalam kumpulan diet teh tarik telah menunjukkan peningkatan berat badan (M=4.00±0.5) yang lebih banyak berbanding dengan kumpulan diet nasi lemak (M=2.00±0.5), t(8) = -4.47, p < 0.05, 95%CI= -0.968, -3.031.
Contoh 2
Skor IQ selepas melalui latihan kelas khas yang diberikan kepada pelajar cerdik pandai dan pelajar biasa.
Cerdik Pandai Biasa Min
24.0
16.5 Var 148.87 139.16
35
29
n
Pooling Variances
Rumus ujian t tadi sesuai digunakan kerana varians dan bilangan sampel setiap kumpulan perbandingan adalah sama. Ini adalah kerana salah satu syarat untuk ujian t dua sampel tidak bersandar adalah varians yang sama (homogeneity of variance) Maka, kita perlu melakukan sedikit modifikasi untuk menyesuaikan rumus ujian t kepada situasi diaman syarat tidak dipenuhi.
Contoh 2
Skor IQ selepas melalui latihan kelas khas yang diberikan kepada pelajar cerdik pandai dan pelajar biasa.
Cerdik Pandai Biasa
24.0
16.5 Min
Var 148.87 139.16 n
35
29
The F Max Test
Menguji jika terdapat perbezaan variance antara dua kumpulan. Assumptions:
Data sampled randomly Data are normally distributed
Pooling Variances
If we want a better estimate of , namely and , it seems appropriate to attain an average of these two values. But a simple average is not suitable because it gives equal weight to both values. (not suitable because sample size not the same)
The t equation again
The F Max Test
Tetapkan hipotesis.df = n-1 k = bilangan kumpulans Kirakan F dan bandingkan dengan F
max max kritikal anda.
Buat kesimpulan. Nak guna pool variance atau tidak?
95% Confidence Interval
Example 3 - of the two-sample t, Empathy by College Major
! " !# $
Empathy Scores # " $ $ " # ! & " ' $ " % & " $ " # $ $ # " #
Output SPSS Check your answers
Now Lets use SPSS to run our
Analysis…
Example 1 Using SPSS
As long as this p-value falls below the standard of “0.05,” we can declare a significant difference between our mean values.
Since “.002” is below “.05” we can conclude: Participants on the teh tarik diet (M = 4.00) gained significantly more weight than those on the nasi lemak diet (M = 2.00), t(8) = 4.47, ' ( ( (two-tailed). Repeat from previous slide:
Example 1 Using SPSS (cont.)
Participants on the the tarik diet (M = 4.00)
gained significantly more weight than those on
the nasi lemak diet (M = 2.00), t(8) = 4.47, ' ( ( (two-tailed).In APA style we normally only display significance to 2 significant digits. Therefore, the probability is displayed as “p<0.01,” which is the smallest probability
(cont.) Example 1 Using SPSS
The SPSS output also displays Levene’s Test for Equality of Variances (see the first 2 columns in second table on slide 30).
Why?
Strictly speaking, the t-test is only valid if we have
approximately equal variances within each of our
two groups.
In our example, this was not a problem because the
2 variances were exactly equal (Variance nasi lemak
= 0.04 and Variance teh tarik= 0.04).
END….
t test-2 Sample Dependent
Introduction
So what if we have two related data set? Pre and post test data? Level of love felt among husband and wife? Repeated measures Matched/related samples
Twins, husband-wife, father-son, mother- daughter, mother-son… Two scores for one case.
When the dependent sample test
is used
When comparing matched samples or repeated scores. Instead of the raw scores, we use the DIFFERENCE SCORE (D).
The t equation again
Degrees of freedom (df)
df = number of pairs – 1
Contoh 1 – balik ke kajian diet kita
Kumpulan Nasi Lemak
- * ) + + , + - + +
1. Tulis Hipotesis
2. Tetapkan alpha ( )
3. Buat pengiraan
4. Dapatkan critical value
5. Lakarkan kawasan penolakan hipotesis nol
6. Buat Keputusan dan tulis kesimpulan
Contoh 1 – Pengiraan
) * . /Χ − Χ = Χ
- + + , + - + +
= − Χ − Χ
=
∑ Langkah 3: Pengiraan
= Χ Χ − Χ = Χ
Χ − Χ = −
Χ − Χ = ∑
The t equation again
Effect Size
Ini bermaksud, min berat badan selepas diet nasi lemak adalah 2.83 sisihan piawai lebih tinggi daripada min sebelum melalui diet nasi lemak.
Effect Size
2.83 sisihan piawai lebih tinggi daripada min sebelum diet ini merupakan peningkatan yang amat signifikan.
Contoh 2
Suatu kajian therapy untuk masalah anorexia telah dijalankan. Sampel kajian adalah 17 budak perempuan. Berat badan telah dicatatkan sebelum dan selepas menjalani terapi tersebut. Data adalah seperti berikut:
Before After Diff Score
Mean83.23
90.49
5.02
8.48
7.16 Hipotesis Tetapkan alpha
α = 0.05
Buat Pengiraan
Dapatkan critical Value
Lakarkan kawasan penolakan nol hipotesis dan buat keputusan.
Effect Size
Latihan 1
Subject Before After Diff score A
10
14 B
15
13 C
12
15 D
11
12 Mean
S