Slide PSI 303 Kuliah IV V Reliabilitas dan Validitas
PENGUKURAN TES PSIKOLOGI :
TEKNIK DAN METODOLOGI
RELIABILITAS DAN VALIDITAS
(2)
Tugas
1. Cari dan jelaskan reliabilitas dan validitas masing-masing tes psikologi berikut:
a. Wechsler-Bellevue Intelligence Scale
b. Edward’s Personal Preference Schedule
c. RMIB
d. Forer Sentence Completion Test
2. Jelaskan perbedaan kuesioner tes kepribadian dan
kuesioner Asperger Syndrome dengan kuesioner no 2 3. Cari dan jelaskan perbedaannya dengan tes-tes
(3)
Pengantar
• Seperti diketahui, tes-tes psikologi sangat banyak
• Pembuatan tes psikologi ???
• Apa benar bisa mengukur apa yg ingin diukur krn kaitannya dengan mental sso??
(4)
RELIABILITAS : KONSEP DASAR
• Definisi : merujuk pada kekonsistenan nilai yang
diperoleh oleh orang yang sama ketika diberikan tes yang sama namun pada waktu yang berbeda.
• Konsep yg mendasari reliabilitas ialah:
penghitungan eror pd st nilai ttt
• Eror yang dimaksud disini adalah : perbedaan antara kemampuan yg sebenarnya yg dimiliki oleh sso
dengan skor yg diperoleh melalui pengukuran yg mengukur kemamp tsb
(5)
• Pada tes psikologi, eror yg dimaksud bukan
merupakan kesalahan test taker atau kesalahan yg disengaja ketika proses pengerjaan tes,
• Namun merupakan ketidaktepatan dalam proses
pembuatan alat tes, seperti faktor2 X yg tdk terukur atau tdk tdeteksi pd pembentukan tes yg mengukur st pl.
• OKI, setelah membuat tes, kita harus mengukur
(6)
• Bahasa statistiknya, bila mlkk reliabilitas tes maka akan didapatkan perkiraan total variance atau variasi total dari nilai tes, yg disebut error variance
• Dengan memiliki tes yg minim eror maka tes tsb semakin reliabel.
• Bila tesnya memiliki banyak eror maka tes tsb tidak relibel.
(7)
• Misal : kita ingin mengukur fluktuasi mood. Maka bila nilai skor tesnya turun naik =
relibilitas = baik/buruk????
• Krn day-by-day changes in scores on a test would be relevant to the purpose of the test =
mengukur mood, krn mood tdk sll sama setiap harinya.
(8)
• Jadi, kondisi apapun yg tdk relevan dgn tujuan tes dibuat dpt menyebabkan error variance
• Sehingga, stp tester hrs mengusahakan kondisi tes yg seragam = lingkungannya, instruksi,
(9)
The Correlational Coefficient
• Ialah : derajat kekonsistenan dari dua nilai yg independent
• Simbol : r = relationship atau korelasi
• Korelasi ada 3 :
- Korelasi positif = kenaikan nilai di var X diikuti kenaikan var Y
- Korelasi negatif = reversal scores from one var to the other.
- Korelasi nol = bila tidak ada hub dari dua variabel yang ada
(10)
Pengukuran Korelasi
• Pearson Product-Moment Correlational Coefficient (PPMCC)
• Hasil dari PPMCC adl :
1. Posisi indv dlm kelomp (SS = standarad score) 2. Jumlah penyimpangan indiv = apk diatas mean or
dibawah mean kelp
• Bila nilai indv jatuh di atas rata2 kelp maka kor + sdgk di bwh rata2 kelp maka kor -
(11)
• Statistical Significance
• Korelasi yg dihasilkan signifikan atau tidak?
• Untuk melihat itu digunakan level signifikansi = yi resiko kesalahan yang akan digunakan u/ menarik kesimpulan dari data yg ada
(12)
• Bila kita menyebutkan bhw korelasi signifikan di level .05 maksudnya adl probabilitas
kesalahannya adl 5 dari 100, begitu seterusnya
• Dalam pengukuran tes, maka level signifikansi yg digunakan kebanyakan .01 dan .05
(13)
How reliable is reliable???
• Seberapa tinggi koefisien reliabilitas dikatakan memiliki reliabilitas yang tinggi?
• Tergantung tes, namun biasanya bila koefisien mencapai .70 atau .80 maka tes tersebut dapat dikatakan reliabel
(14)
BERBAGAI TIPE RELIABILITAS
1. Metode Tes-retest
• Ialah : metode yg digunakan u/ m’cari reliabilitas
dgn cara mengulang tes yg sama pada dua kesempatan yg berbeda
• Rtt yg diperoleh merupakan korelasi dari nilai tes individu yang diperoleh di waktu pengetesan yg berbeda
(15)
• Error variance yg diperoleh berasal dr fluktuasi
performance indiv di sesi 1 dan 2
• Variasi ini krn situasi pengetesan yg tdk dpt dikontrol, spt suasana, cuaca, sudden noises, broken pencil, dll.
(16)
• Selain itu eror dpt disebabkan keadaan indv ketika melakukan tes, spt sakit, cemas,
khawatir, dll
• Evaluasi test-retest
- Kelebihan : simpel dan straightforward
- Kekurangan : interval pendek = recall their
former responses, shg korelasinya akan tinggi. Hal ini menjadikan nature of the test itself may also change with repetition.
(17)
BERBAGAI TIPE RELIABILITAS
2. Alternate-Form Reliability
• Salah satu metode mendapatkan reliabilitas tes dgn memberikan tes yg bentuknya setara pada kesempatan yg berbeda namun pada
indv yang sama
• Jadi harus diperhitungkan juga interval pemberian tesnya.
(18)
3. Split-Half Reliability
• Internal consistency : apakah belahan 1 dan belahan 2 itemnya konsisten = content
sampling
• Yang dilihat adalah item-itemnya konsisten apa tdk
• Antara belahan 1 dan 2 dikorelasikan, bila kor nya tinggi maka tes tsb reliable
(19)
4. Kuder-Richardson Reliability dan Coefficient Alpha
• Single administration of single form
• Yang ditekankan adalah inter item consistency = yi konsistensi jawaban terhadap item
• Eror variance nya didpt dari : 1. Content sampling
(20)
Sumber error dalam metode asesmen
reliabilitas
Sumber eror Contoh Metode How assessed
Time sampling Tes yg sama diberikan pada 2 wkt yg berbeda
Tes-retest Korelasi ant 2 skor yg didapat pada 2 kesempatan tsb. Item sampling Item-item yg
berbeda yg
digunakan untuk mengukur 1 pl
Alternate forms or parallel forms
Korelasi antara bentuk tes yg mirip yg memiliki item2 yg berbeda
Internal consistency
Item2 yg konsisten pada tes yg sama
Split half, KR20, dan alpha cronbach Observer
differences
Catatan yg berbeda dari msg2 observer
(21)
VALIDITAS : KONSEP DASAR
• Ialah : apakah tes mengukur apa yang ingin
diukur dan seberapa jauh dpt mengukur apa yg ingin diukur tsb
• Jd jangan tll percaya dengan judul dari tes, biasanya hiperbola
• So, kl ingin buat alat tes yang baik jg harus
memberikan nama yg baik shg bila sso melihat nama tes tsb, lgs mengetahui apa yg diukur o/ tes tsb
(22)
• Lebih lanjut lagi, validitas tes tdk dpt
dilaporkan sbg “tinggi” atau “rendah” tp apk
isi tes tsb mengukur apa yg ingin diukur
• Misal : tes informal “ingin mengetahui
kemampuan berhitung anak usia 5 thn”. Isi tes
= kebanyakan soal2 yg kaitannya dgn geometrik = TES TDK VALID
• Tes yg valid bila isinya : contoh : sebutkan urutan angka 1 – 50, dll
(23)
• Fundamentally, all procedures for determining test validity are concerned with relationship
between performance on the test and other independently observable facts about the
(24)
METODE MENDAPATKAN
VALIDITAS TES
1. Content-Description Procedures
• Melibatkan pemeriksaan sistematis terhadap isi tes
u/ melihat apk tes tsb m’cover contoh perilaku yg
akan diukur
• Caranya :
- Menggunakan subject-matter expert
- Item2 yg didapat dr expert dispesifikkan = topiknya, tujuan instruksional tes
- Stlh itu ditentukan brp item yg dibutuhkan untuk mengukur hal2 yg sdh dispesifikkan sblmnya.
(25)
• Content-validity jangan disamakan dgn face validity
• Krn face validity bukan fokus pd cara2
pengukuran tes tapi lebih pada apa2 saja yg muncul dipermukaan (superficially)
(26)
2. Construct-Identification Procedures
• Construct-validity berfokus pd peran teori2 psikologi. Hal ini dilakukan untuk menyusun definisi operasional tingkah laku yg akan
diukur dlm tes
• Contoh konstrak adl aptitude, scholastic,
verbal fluency, mechanical comprehension, dll
(27)
3. Criterion-Prediction Procedures
• Prosedur ini mengindikasikan keefektifan tes dalam memprediksi kinerja individu di masa yad
• Jd sering disebut : predictive validity
• Item2nya tsb dpt memprediksi kinerja indv di masa yad
(28)
• Misal : tes bakat = apk tes tersebut dpt
meramalkan performance kita di masa yad.
• Contoh lain : tes yg diberikan u/ job
applicants, students = selecting students for admission to professional school, dll.
(1)
• Fundamentally, all procedures for determining test validity are concerned with relationship
between performance on the test and other independently observable facts about the
(2)
METODE MENDAPATKAN
VALIDITAS TES
1. Content-Description Procedures
• Melibatkan pemeriksaan sistematis terhadap isi tes u/ melihat apk tes tsb m’cover contoh perilaku yg akan diukur
• Caranya :
- Menggunakan subject-matter expert
- Item2 yg didapat dr expert dispesifikkan = topiknya, tujuan instruksional tes
- Stlh itu ditentukan brp item yg dibutuhkan untuk mengukur hal2 yg sdh dispesifikkan sblmnya.
(3)
• Content-validity jangan disamakan dgn face validity
• Krn face validity bukan fokus pd cara2
pengukuran tes tapi lebih pada apa2 saja yg muncul dipermukaan (superficially)
(4)
2. Construct-Identification Procedures
• Construct-validity berfokus pd peran teori2 psikologi. Hal ini dilakukan untuk menyusun definisi operasional tingkah laku yg akan
diukur dlm tes
• Contoh konstrak adl aptitude, scholastic,
verbal fluency, mechanical comprehension, dll
(5)
3. Criterion-Prediction Procedures
• Prosedur ini mengindikasikan keefektifan tes dalam memprediksi kinerja individu di masa yad
• Jd sering disebut : predictive validity
• Item2nya tsb dpt memprediksi kinerja indv di masa yad
(6)
• Misal : tes bakat = apk tes tersebut dpt
meramalkan performance kita di masa yad.
• Contoh lain : tes yg diberikan u/ job
applicants, students = selecting students for admission to professional school, dll.