Kriteria dalam pengukuran Psikometri doc

Kriteria dalam Pengukuran
1. Pengertian Kriteria
Proses asesmen psikologi diawali dengan kegiatan pengukuran
yang akan menghasilkan data yang dideskripsikan dalam bentuk angka.
Selanjutnya dilakukan perbandingan hasil pengukuran dengan suatu
kriteria agar dapat menarik kesimpulan hasil pengukuran yang berkenaan
dengan atribut yang diukur. Proses perbandingan tersebut dinamakan
evaluasi atau penilaian, dan memerlukan suatu kriteria yang digunakan
sebagai pembandingnya.
Istilah pengukuran (measurement) sangat berkaitan dengan istilah
penilaian (evaluation). Pengukuran adalah istilah yang merujuk pada
upaya untuk mendeskripsikan data, sedangkan penilaian merujuk pada
pengertian proses perbandingan hasil pengukuran dengan suatu kriteria.
Pengukuran yang tidak diikuti dengan langkah penilaian tidak akan
menghasilkan deskripsi data yang mengandung arti yang jelas. Skor hasil
pengukuran hanya mendeskripsikan sebagaimana adanya atribut yang
diukur dalam bentuk angka. Misalkan angka kecerdasan seorang
mahasiswa dengan menggunakan suatu tes adalah 84. Angka ini tidak
bermakna jelas, apakah mahasiswa tersebut adalah individu yang sangat
cerdas, ataukah yang agak cerdas. Barulah angka tersebut punya arti jika
kita memiliki data lain dari individu yang berbeda yang diukur dengan tes

yang sama misalkan 98. Individu pertama yang kurang cerdas
dibandingkan dengan individu kedua. Atau individu kedua memiliki
kuallitas atribut yang lebih baik daripada individu kedua. Dapat pula kita
menggunakan pembanding lain misalkan klasifikasi angka kecerdasan
menurut Louis Terman bahwa kecerdasan berada pada taraf normal atau
rata-rata jika mendapat skor antara 90-110. Dengan menggunakan kriteria
ini maka kita dapat menarik kesimpulan bahwa kecerdasan individu
pertama berada pada taraf di bawah rata-rata. Sedangkan individu kedua
memiliki kecerdasan yang sama dengan kebanyakan orang pada tingkat
usia yang sama atau memiliki kecerdasan pada taraf rata-rata. Dengan
1

menggunakan suatu kriteria atau pembanding maka hasil pengukuran
dapat disimpulkan atau dapat diinterpretasikan.
Asesmen seperti diuraikan diatas merupakan proses lanjutan dari
kegiatan pengukuran dan penilaian, atau dengan perkataan lain dapat
dinyatakan bahwa keseluruhan prosedur itulah yang disebut dengan
asesmen. Asesmen adalah proses penarikan kesimpulan berdasarkan data
deskriptif dan hasil perbandingan dengan suatu kriteria. Melalui proses
asesmen inilah kita dapat memahami karakteristik individu sehingga dapat

dilakukan kegiatan lanjutan berupa penetapan diagnosis bahkan prognosis.
Dalam proses pemberian bantuan psikologi terhadap individu yang
mengalami

masalah

psikologi,

proses

seperti

ini

dinamakan

psikodiagnostika. Ketepatan dalam merumuskan tindakan pemberian
bantuan atau saran ataupun yang biasa dianamakan teknik intervensi,
sangat tergantung pada ketepatan diagnosis dan prognosisnya. Selanjutnya
jika diurut kebelakang, maka ketepatan diagnosis tergantung pada kriteria

yang digunakan, bahkan tergantung pula pada tingkat ketepatan instrument
yang digunakan dalam pengukuran.
Pemilihan

kriteria

yang

tepat

akan

menentukan

kualitas

kesimpulan yang dibuat. Jika yang digunakan adalah kriteria kelompok
maka dasar kesimpulan adalah kelompok dimana individu yang dinilai
menjadi anggota kelompok tersebut, sehingga kesimpulannya tidak
berlandaskan pada ukuran ideal. Apalagi jika kriterianya adalah individu

lain maka kesimpulannya hanya akan dapat menemukan apakah individu
yang dinilai lebih atau kurang dibandingkan dengan individu lain yang
digunakan sebagai kriteria. Jika kita menggunakan kriteria kecerdasan dari
Louis Terman tersebut diatas, dalam menarik kesimpulan tentang taraf
kecerdasan mahasiswa kita, kemungkinan saja krtiteria itu terlalu tinggi
atau terlalu rendah dan tidak sesuai dengan ukuran rata-rata orang
Indonesia. Timbulah pertanyaan kriteria seperti apa yang tepat untuk
digunakan dalam proses asemen yang kita lakukan, dan ternyata banyak
pilihan tersedia dalam penetapan kriteria tersebut.

2

2. Jenis Kriteria
Jenis kriteria yang dapat digunakan untuk menarik kesimpulan
tentang kualitas atribut yang diukur dari individu, menurut pendapat
Kower (1975) adalah sebagai berikut:
1) Kriteria Objektif
Semua fakta tentang perilaku yang dituntut dalam suatu
tugas tertentu untuk dapat dikatakan berhasil. Misalkan kriteria
untuk suatu tes psikologi yang ditetapkan dalam mengukur

atribut bakat teknik adalah rata-rata skor yang dicapai
sekelompok subjek yang benar-benar menunjukkan bakat
teknik yang tinggi sebesar 54. Maka dengan kriteria

ini

individu yang hasil pengukuran bakat tekniknya mendapat skor
55 dengan tes itu, disimpulkan memiliki bakat teknik yang
tinggi.
2) Krtiteria Subjektif
Pembanding yang digunakan berupa judgment, pendapat
orang-orang yang ahli/kompeten dan mengetahui secara pasti
permasalahan yang diukur. Misalnya pendapat para ahli tentang
patokan/ukuran minimal yang menggambarkan keberhasilan
individu dalam belajar atau dalam bekerja.
3) Kriteria Langsung
Patokan yang ditetapkan berupa bentuk perilaku, sikap,
tindakan,

atau


prestasi

dan

lainnya,

sebagai

ukuran

keberhasilan sesuai dengan perilaku yang diukur. Misalkan
seorang siswa sekolah penerbang dinyatakan telah berhasil dan
lulus jika telah benar-benar dapat menerbangkan pesawat.

4) Kriteria Intermedier
Kriteria ini menetapkan patokan pada apa yang harus
dicapai subject pada tahapan-tahapan tertentu sepanjang proses
pelaksanaan tugas. Misalkan dari suatu program kegiatan


3

ditetapkan ukuran keberhasilan tiga bulan pertama apa yang
harus dicapai, tiga bulan kedua, sampai pada tahap terakhir
telah ditetapkan ukuran keberhasilannya.
5) Kriteria Akhir
Suatu ukuran yang seharusnya dicapai pada akhir
program, atau akhir kegiatan, jika semua proses perilaku telah
dilaksanakan.
Thondike (1991) menggambarkan jenis kriteria objektif/kuantitatif
yang dapat digunakan sebagai penimbang. Thorndike menyatakan bahwa
terdapat dua jenis kriteria kuantitatif yaitu kriteria mutlak dan kriteria
kelompok.
1) Kriteria Mutlak (Absolute Criterion)
Suatu pembanding dinamakan kriteria mutlak jika berasal
atau diambil dari ukuran ideal atau yang seharusnya. Misalkan
jika instrument itu memiliki 20 item dan maksimum skornya
dalah 100, maka skor maksimum atau ideal ini yang dijadikan
pembanding.


Dengan

demikian

taraf

pencapaian

seharusnyaatau ideal ini yang digunakan sebagai pembanding
sehingga skor yang dicapai subjek dalam tes dinilai jauh atau
mutlak terdiri dari:
a. Conetnt Reference / Performance Reference
Kriteria ini berwujud suatu pernyataan tentang apa
yang dilakukan individu dalam tes dibandingkan dengan
kondisi ideal yang dapat diukur dengan tes itu. Misalkan
seorang subjek dapat menyelesaikan 15 item dengan benar
dari idealnya adalah 20 item, dengan skor tiap item benar
adalah satu. Maka subjek tersebut dinilai dengan cara 15:20
maka apa yang dapat dilkukan subjek dalam tes itu hanya
75% dariu pencapaian yang seharusnya (ideal).

b. Expectancy Reference
Hasil pengukuran dibandingkan dengan prestasi yang
diharapkan (expectation) berdasarkan apa yang pernah
dicapai sebelumnya. Seharusnya subjek menampilkan

4

performance sesuai dengan yang pernah ditampilkan
sebelumnya. Maka hasil pengukuran yang sekarang
seharusnya

sama

atau tidak

berbeda dengan hasil

pengukuran pada waktu sebelumnya, jika atribut yang
diukurnya adalah sama walaupun alat ukurnya berbeda.
Seoarang siswa kelas 4 seharusnya memiliki

kemampuan berhitung yang sama atau bahkan lebih baik
jika dibandinngkan dengan kemampuan berhitung pada saat
dia ke;las 3.
c. Self Reference
Hasil tes yang dicapai sekarang dibandingkan dengan
hasil pengukuran dengan instrument yang sama pada waktu
yang lalu. Artinya subjek seharusnya sudah berulangkali
menjalani tesx atau pengukuran atribut tersebut dengan
instrument yang sama. Sehingga hasil tes dibandingkan
dengan skor yang telah dicapai sebelumnya. Pernyataan
hasil komparasi misalnya dapat berbunyi: kecepatan kerja
subjek sudah dua kali lebih cepat dari tahun yang lalu. Atau
skor Toeflnya sudah meningkat 50 oint dibandingkan
dengan 3 bulan yang lalu.
2) Kriteria Kelompok (Norm Criterion)
Kriteria kelompok atau seringkali juga disebut dengan
norma, adalah suatu pembanding berupa pencapaian kelompok
dimana subjek yang diukur menjadi anggota dari kelompok
tersebut. Norma merupakan performance sekelompok orang
yang ditampilkan dalam data suatu tes berupa distribusi skor

yang diperoleh dari hasil pengukuran terhadap sekelompok
orang. Data yang membentuk norma secara ideal seharusnya
merupakan data yang representative dari suatu populasi dimana
tes tersebut dirancang untuk digunakan. Sehingga subjek yang
dinlai

dengan

norma

tersebut

benar-benar

memiliki

karakteristik yang sama dengan populasi tadi. Norma yang

5

dikembangkan melalui prosedur seperti ini dinamakan norma
yang standard.
Disamping norma yang standard dapat ditemukan pula
norma yang berlaku local. Artinya kelompok acuan yang
digunakan sebagai dasar pembentukan norma adalah kelompok
kecil dan terbatas. Misalkan satu kelas mahasiswa yang
berjumlah 80 orang menjalani tes. Maka hasil tes setiap subjek
dibandingkan dengan performance sekelompok mahasiswa
tersebut. Pada umumnya penetapan norma berlandaskan pada
rata-rata hitung seperti mean, median, atau modus. Fungsi dari
norma adalah untuk mendapatkan informasi tentang skor tes
dari suatu populasi. Sehingga nantinya skor itu dapat
ditransformasikan ke dalam suatu set data yang memiliki arti
atau dapat diinterpretasikan. Kedua fungsi dari norma adalah
untuk menentukan kedudukan individu dalam kelompok.
Beberapa jenis norma atau kriteria kelompok yang sering
digunakan adalah:
a. Grade Norm
Anastasi menyebutkan dengan Grade Equivalent
(1997) dan menyatakan bahwa kriteria ini merupakan
pembanding

yang

dibentuk

berdasarkan

pada

segi

ekivalensi kelas. Artinya skor yang mengelompok pada
grade/kelas tingkatan tertentu, dan pengelompokan skor itu
berdasarkan pada mean, median, atau modus. Subjek yang
diukur dalam suatu atribut, mendapatkan skor tertentu,
maka dalam penilaian skor itu termasuk atau ekivalen
dengan skor kelompok subjek pada grade/tingkatan yang
mana.
Norma berdasarkan tingkat atau grade dibentuk
melalui perhitungan mean, median, atau modus dari skor
sejumlah subjek pada setiap tingkat, yang merupakan
sampel representative. Dengan demikian jika rata-rata skor
yang diperoleh siswa kelas 4 dalam tes aritmatika adalah 23
maka skor 23 berhubungan dengan ekivlen kelas/tingkat 4
6

sekolah dasar. Skor ekivalen pada kelas/grade lain juga
dapat diperoleh dengan menguji sejumlah siswa yang
menjadi sampel, kemudian menghitung rata-rata skor dari
kelas/grade tersebut. Prosedur pembentukan grade norm
adalah sebagai berikut:
- Berikan tes kepada sekelompok subjek sebagai
-

sampel
Subjek terdiri kelompok pada beberapa grade

-

yang berbeda
Hitung skor rata-rata pada setiap grade

Contoh grade norm dari suatu tes.

Mean
19

Grade Equivalents
3

27

4

35

5

43

6

Siswa

yang

memeroleh

skor

27

berarti

kemampuannya setara dengan pada umumnya siswa yang
berada pada tingkat atau grade 4 karena skor itu berada
pada Grade Equivalents (GE) 4.
b. Age Equivalents atau Age Norm
Dalam skala umur, item persoalan tes dikelompokan
ke dalam tingkatan usia. Misalkan sejumlah item yang
dapat diselesaikan dengan tepat oleh sekelompok anak
berusia 7 tahun atau dengan kata lain skor rata-rata pada
kelompok usia itu adalah 45. Skor inilah yang menjadi
pembanding bagi setiap anak yang diukur jika berusia 7
tahun. Contohnya adalah anak

usia 7 tahun hanya

mendapat skor 40, berarti anak tersebut memiliki
kemampuan di bawah kemampuan anak lain yang seusia
dalam atribut yang diukur. Atau contoh lainnya jika anak
berusia 9 tahun mendapat skor 45pada tes tersebut artinya

7

anak itu memiliki kemampuan yang setingkat dengan anak
yang berusia 7 tahun.
Contoh norma umur:
80
70
60
50
40
30
20
10
0
5
6
7

8

9

10

c. Percentile Norm
Skor-skor persentil diungkapkan dalam kaitan dengan
persentase orang dalam sampel yang berada di bawah skor
tertentu. Misalkan terdapat 28% orang hanya dapat
menyelesaikan dengan benar kurang dari 15 soal dalam
penalaran aritmatika, maka skor mentah itu dapat
disamakan dengan persentil ke 28.
Skor persentil menunjukan posisi relatif individu
dalam sampel. Persentil dapat dianggap sebagai peringkat
dalam suatu kelompok subjek yang jumlah anggotanya 100
orang. Dengan catatan bahwa dalam penentuan peringkat
biasnya orang mulai menghitung dari atas, subjek terbaik
menduduki peringkat satu. Sebaliknya

subjek yang

mendapat skor terendah akan menduduki peringkat 100.
Namun dalam persentil kita menghitung dari bawah
dimulai dari skor terendah. Maka subjek yang mendapat
skor buruk berada pada posisi di bawah dan makin tinggi
skor yang diperoleh subjek maka posisinya akan makin
tinggi. Skor pada suatu titik persentil misalkan 45,
memisahkan 45 persen subjek berada di bawah posisi
individu yang mendapatkan skor tersebut dan 56 persen
subjek berada pada posisi diatas skor tersebut.
Contoh norma persentil:

Persentil

Skor pada Atribut X
8

90
.
.
97
.
.
.
.
.
50
.
48
.
.
.
.
.
10

77-90
.
.
73-76
.
.
.
.
.
41-43
.
38-40
.
.
.
.
.
0-14

d. Standard Score Norm
Norma yang paling banyak digunakan sekarang ini
adalah norma skor standar yang merupakan tipe norma
yang

paling

memuaskan.

Pembentukan

norma

ini

berdasarkan pada suatu proses yang diawali dengan
pengukuran atribut psikologis tertentu pada sekelompok
subjek sebagai sampel yang representatif dari suatu
pupolasi. Skor yang ditampilkan dalam norma ini
menunjukan jarak skor individu dari rata-rata dalam kaitan
dengan simpangan baku dari distribusi skor. Biasanya
norma skor standar diperoleh melalui transformasi linier
maupun non linier dari sekumpulan skor mentah. Skor
standar dinamakan skor-z. untuk menghitung skor-z
dilakukan dengan menemukan perbedaan antara skor
mentah individu dengan skor rata-rata kelompok, kemudian
membagi perbedaan ini dengan simpangan baku kelompok
itu.
Jika M = 60 dan SD = 5, maka skor standar untuk
subjek yang mendapat skor mentah 65 adalah:
z = +1,00
Jika subjek mendapat skor mentah 58, maka z nya = -0,40.
Perhitungan skor-z diatas adalah untuk dua subjek, subjek
pertama berada +1 SD di atas kelompok rata-rata,

9

sedangkan subjek kedua berada pada posisi 0,40 SD di
bawah rata-rata kelompok. Skor mentah yang tepat berada
pada posisi ekivalen dengan skor rata-rata adalah z = 0.
Nampak dari prosedur diatas bahwa individu yang
mendapat skor di bawah rata-rata akan mendapat skor z di
bawah 0 atau memiliki tanda negatif. Kebanyakan rentang
skor SD yang digunakan adalah -3,00 di atas atau bertanda
+ dan 3,00 di bawah atau bertanda negatif. Berdasarkan
tentang skor SD yang digunakan ini ditetapkan skor standar
berjenjang 5 atau 6, 7, 9 atau 11 dst. Sehingga ditemukan
adanya istilah stanfive, stanine, staneleven, dan sebagainya.
Proses penyusunan norma standar lainnya dihitung
berdasarkan penyimpangan (deviasi) dari mean. Misalkan
dari distribusi skor hasil pengukuran terhadap sejumlah
subjek ditetapkan menjadi 5 kategori, diperoleh mean = 55
dn standar deviasi 10. Maka batas atas kategori 1
dinyatakan pada M -2 SD, kategori 2 diantara -2 SD sampai
dengan M -1 SD, kategori 3 antara -1 SD sampai dengan M
+1 SD, kategori 4 antara M +1 SD sampai dengan M +2 SD
dan kategori 5 dengan batas bawah pada M +2 SD.

10

TUGAS PSIKOMETRI
KRITERIA DALAM PENGUKURAN

DIBUAT OLEH
NAMA

: MUHAMMAD RIDWAN

NIM

: 13181005

FAKULTAS

: PSIKOLOGI

UNIVERSITAS BINA DARMA
PALEMBANG
2015
11