p : proporsi peserta tes yang m enjaw ab benar pada butir
soal q
: 1 - p St
: standar deviasi seluruh skor tes K orelasi
biserial
secara m atem atis dinyatakan dengan rumus sebagai berikut.
M
v
- M
t
p
dengan keterangan
rbis
adalah koefisien korelasi
biserial, y
adalah ordinat p dalam distribusi norm al, sedangkan sim bol lain sama dengan keterangan
sebelumnya. N ilai korelasi
point biserial
selalu lebih rendah dibanding dengan nilai korelasi
biserial.
H ubungan antara keduanya dinyatakan dengan rumus: y
rpbis rb is ■ i
------- v p . q
3. Efektivitas Distraktor
Soal pilihan ganda perlu m em iliki pengecoh, yaitu jaw aban yang tidak bernilai benar. Pengecoh perlu dibuat sedem ikian rupa sehingga m enarik
perhatian peserta tes yang belum m em iliki konsep yang baik terhadap m ateri yang diujikan. A llen dan Y en 1979 m enyatakan bahw a pengecoh yang baik m inim um
berindeks 0,1 yang berupa koefisien korelasi point biserial, bernilai p o sitif untuk kunci jaw aban dan bernilai negatif untuk pengecoh.
4. Kesalahan Pengukuran
K esalahan Pengukuran
Standard Error o f Measurement,
SEM m em bantu penyusun tes dalam m em aham i kesalahan yang bersifat acak yang m em pengaruhi
5
skor peserta tes. K esalahan pengukuran dihitung dengan rum us sebagai berikut B ahrul H ayat, dkk., 1999:
°
e
= ° x V 1 — p xx dengan keterangan
ox
adalah standar deviasi dari skor total dan p x x adalah koefisien reliabilitas tes.
5. Reliabilitas Tes
R eliabilitas tes dapat diartikan sebagai keajegan atau konsistensi hasil pengukuran atau hasil tes yang dilakukan pada w aktu yang berbeda pada subjek
yang sama. A llen dan Y en 1979 m enyatakan bahw a tes disebut reliabel jik a skor am atan m em punyai korelasi yang tinggi dengan skor yang sebenarnya. M ereka
ju g a m enyatakan bahw a reliabilitas m erupakan koefisien korelasi antara dua skor am atan yang diproleh dari hasil pengukuran m enggunakan tes yang paralel.
Reliabilitas suatu tes dapat dihitung dengan beberapa cara dan form ula. Cara atau form ula belah dua, alfa a Cronbach, G uttm an, dan paralel dapat
digunakan. N ilai hasil perhitungan dari form ula tersebut sering dikatakan sebagai koefisien reliabilitas. M ehrens dan Lehm ann 1973 m enyatakan bahw a m eskipun
tidak ada ketentuan um um , tetapi secara luas dapat diterim a bahw a untuk tes yang digunakan untuk m em buat keputusan secara perorangan harus m em iliki koefisien
reliabilitas m inim al 0,85. K eterbatasan pada teori tes klasik adalah adanya sifat
group dependent
dan
item dependent
H am bleton, Swam inathan, Rogers, 1991: 2-5, ju g a indeks daya pem beda, tingkat kesulitan, dan koefisien reliabilitas tes ju g a tergantung
kepada peserta tes yang m engerjakan tes tersebut. 6
U ntuk m engatasi kelem ahan-kelem ahan yang ada pada teori tes klasik,
para ahli pengukuran m encari m odel alternatif. H am bleton, Sw am inathan, Rogers 1991: 2-5 serta H ulin, D rasgow , Parsons 1983, m enyatakan
seharusnya m odel alternatif ini m em iliki sifat : a statistik butir tidak tergantung pada kelom pok subjek, b skor tes dapat m enggam barkan kem am puan subjek, c
m odel dinyatakan dalam tingkatan butir, tidak dalam tingkatan tes, d m odel tidak m em erlukan tes paralel untuk m enghitung koefisien reliabilitas, dan e m odel
m enyediakan ukuran yang tepat untuk setiap skor kem am puan. M odel alternatif ini adalah m odel pengukuran yang disebut dengan teori respons butir
Item Response Theory.
B. Teori Respons Butir