pengabdian masyarakat pengantar teori respons butir 25 maret 2010

(1)

K E M E N T E RIAN P E N DIDIK AN N AS ION AL

D IRE K T O RA T J E N D E R A L M A N A JE M E N P E N DIDIKAN DAS AR DAN ME N E N G A H D IRE K T O RA T P E MB IN AAN S E K O L A H ME N E N GAH P E RT AMA

Didik Suhardi, SH., M.Si.

NIP. 19631203 198303 1 004

Nomor: 0630/C3/KP/2010

Diberikan kepada

IKama

: <Dr

:

SamsuCjfadi, ‘M.Kpm

Vnit %erja

: VNYYogyakarta, %a6upaten SCeman

, ©./

Yogyakarta

JZtas partisipasi aktif se6agai

y/arasum6er

(PeCatihan Calon (Pe(atifi(Training o f drainer) 6agi Tun Pengembang Kjiri^uCum (Propinsi yang diselenggarakan diInaSimpang - SuraSaya, JL (jubenurSuryo 1- 3, Sura6aya -Jawa 'Hmur

Jakarta, 25 Maret 2010

a.n. Direktur Jenderal

Manajemen Pendidikan Dasar dan Menengah

Direktur Pembinaan Sekolah Menengah Pertama

(2)

STRUKTUR PROGRAM

ToT Tim Pengembang Kurikulum (TPK) Propinsi Tahun 2010

NO. PROGRAM DAN MATERI JUMLAH JAM

A. PROGRAM UMUM

1 .

Kebijakan Direktorat Pembinaan SMP 2 JP

2. Ujian Nasional 2009/ 2010 2 JP

3. Karakteristik SMP Terbuka 3 JP

B. PROGRAM INTI

4. Identifikasi Materi UN yang Sulit Dikuasai Siswa 2 JP

5. Pengkajian dan Pendalaman Materi UN yang Sulit Dikuasai Siswa 8 JP

6. Penjabaran Kisi-Kisi UN 2009/ 2010 4 JP

7. Pengembangan dan Pembahasan Soal sesuai Kisi-Kisi UN

2009/ 2010 16 JP

8. Teori Respon Butir 2 JP

9. Praktik Analisis Soal dengan Pendekatan Teori Respon Butir 4 JP

10. Rancangan Bimbingan/ Pendampingan Teknis untuk Peningkatan

Rerata Nilai UN dan Angka Kelulusan SMP 4 JP

11. Pre & Post test 2 JP

12. Evaluasi Bimtek (Direktorat) 1 JP

(3)

PENGANTAR

TEORI RESPONS BUTIR

M ateri D isam paikan pada

Training o f Trainer

T im Pengem bang Propinsi

di H otel Ina Sim pang Surabaya 25 M aret 2010

Oleh: Sam sul H adi

(Fakultas T eknik U niversitas N egeri Y ogyakarta)

Kementerian Pendidikan Nasional

Direktur Jenderal Manajemen Pendidikan Dasar dan Menengah

Direktorat Pembinaan Sekolah Menengah Pertama

(4)

PENGANTAR TEORI RESPONS BUTIR

Sam sul H adi

(Fakultas T eknik U niversitas N egeri Y ogyakarta)

A. Pendahuluan

Tes yang dilalukan oleh guru digunakan untuk m engetahui pencapaian standar kom petensi lulusan atau turunannya berupa standar kom petensi, kom petensi dasar, atau indikator dari suatu m ata pelajaran yang harus dikuasai oleh siswa. Supaya tes dapat m engukur pencapaan kom petensi, m aka tes harus dibuat m em enuhi validitas isi, yaitu butir-butir soal yang ada harus benar-benar diturunkan dari standar kom petensi lulusan, standar kom petensi, kom petensi dasar, atau indikator dari suatu m ata pelajaran.

Supaya tes m em enuhi validitas isi penyusunan butir soal diaw ali dengan m engkaji standar kom petensi lulusan, standar kom petensi, kom petensi dasar, atau indikator dari suatu m ata pelajaran. Berdasarkan kisi-kisi tersebut kem udian dibuat butir-butir soal. B utir-butir soal yang sudah jad i kem udian dim inta untuk ditelaah oleh pihak lain yang dianggap m am pu dengan m em perhatikan: m ateri, konstruksi, dan bahasa yang digunakan dalam butir soal.

Telaah m ateri bertujuan untuk m elihat kesesuaian soal sudah sesuai dengan indikator, kesesuaian m ateri soal dengan tuntutan kom petensi (urgensi, relevansi, kontinyuitas, keterpakaian yang tinggi), dan kesesuaian m ateri dengan jenjang jenis sekolah atau tingkat kelas. Telaah konstruksi bertujuan untuk m enjam in bahw a soal telah dirum uskan dengan singkat, bebas dari pernyaatn yang tidak relevan, bebas dari pernyataan negatif ganda, dan bebas dari

(5)

pernyataan yang m ulti interpretasi. Telaah bahasa dilakukan agar soal kom unikatif dan sesuai dengan jenjang pendidikan sisw a serta m enggunakan bahasa Indonesia yang baku.

H asil telaah m ateri, konstruksi, dan bahasa dijadikan m asukan perbaikan terhadap butir soal yang ada. Setelah perbaikan dilakukan berdasarkan telaat ketiga hal tersebut, soal siap diujicobakan kepada siswa. D ata yang diperoleh dari hasil ujicoba perlu dianalisis untuk m engetahui karakteristik soal atau butir soal secara em piris. A da dua pendekatan untuk m enganalisis data hasil ujicoba soal, yaitu m enggunakan teori tes klasik dan m enggunakan teori respons butir.

A. Teori Tes Klasik

K ualitas tes atau butir soal penyusun tes yang baik dapat dilihat dari karakteristikya. K arakteristik tes atau butir dapat diketahui dengan dua pendekatan teori. K edua pendekatan tersebut yakni teori tes klasik dan teori respons butir. Teori tes klasik, atau disebut ju g a teori tes skor m urni klasik,

didasarkan pada m odel aditif, yaitu skor am atan m erupakan penjum lahan dari

skor sebenarnya dan skor kesalahan pengukuran (Allen & Yen, 1979: 57).

Secara m atem atis pernyataan tersebut dapat dirum uskan sebagai berikut.

X = T + E

dengan :

X

: skor amatan,

T

: skor murni,

(6)

Kesalahan pengukuran dalam teori tes klasik m erupakan kesalahan yang tidak sistem atis atau acak. K esalahan pengukuran m erupakan penyim pangan secara teoretis dari skor am atan yang diperoleh dengan skor am atan yang diharapkan. K esalahan pengukuran yang sistem atis dianggap bukan m erupakan kesalahan pengukuran.

A sum si-asum si yang m endasari teori tes klasik tersebut dijadikan dasar untuk m engem bangkan rum us-rum us m atem atis untuk m engestim asi validitas dan koefisien reliabilitas tes. V aliditas dan koefisien reliabilitas pada perangkat tes digunakan untuk m enilai kualitas tes. K ualitas tes dalam teori tes klasik ju g a dapat ditentukan dengan indeks kesukaran dan daya pem beda.

1. Tingkat Kesukaran

Tingkat kesukaran, disim bolkan dengan p , m erupakan salah satu param eter butir soal yang sangat berguna dalam analisis soal. Tingkat kesukaran dapat dihitung dengan berbagai cara, yaitu (a) skala kesukaran linear, (b) skala bivariat, (c) indeks D avis, dan (d) proporsi m enjaw ab benar (B ahrul H ayat, dkk., 1999). Secara m atem atis tingkat kesukaran yang dihitung dengan proporsi m enjaw ab benar dirum uskan dengan:

I B

P =

—

dengan keterangan B adalah banyak peserta tes yang m enjaw a benar, dan N jum lah peserta tes yang m enjaw ab. D engan rum us tersebut, m aka dapat diketahui bahw a jik a p m endekati 0, m aka soal tersebut terlalu sukar, sedang jik a p m endekati 1 m aka soal tersebut terlalu m udah. Soal yang terlalu m udah atau

(7)

terlalu sukar tidak dapat m em bedakan kem am puan peserta tes sehingga perlu dibuang.

M enurut A llen dan Y en (1979) tingkat kesukaran butir soal sebaiknya antara 0,3 - 0,7. Pada rentang tersebut inform asi tentang kem am puan sisw a akan diperoleh secara m aksim al. N am un angka tersebut perlu disesuaikan dengan tujuan pengem bangan soal. Soal untuk keperluan seleksi, rem idi, atau ulangan um um seharusnya m em punyai p yang berbeda-beda untuk m encapai tujuan yang m aksim al.

2. Daya Beda

D aya beda m erupakan param eter butir soal yang m em berikan inform asi tentang seberapa besar butir soal tersebut dapat m em bedakan peserta tes yang skornya tinggi dan peserta tes yang skornya rendah. D aya beda dapat dihitung

dengan beberapa cara antara lain dengan m enghitung koefisien korelasi

point

biserial

dan koefisien korelasi

biserial.

K orelasi

point biserial

secara m atem atis

dirum uskan sebagai berikut.

Mp — Mq -

---rpbis

n Vp 9

^t dim ana:

rpbis

: koefisien korelasi

point biserial

Mp

mean

skor pada tes dari peserta tes yang m em iliki jaw aban benar pada

butir soal

Mq

mean

skor pada tes dari peserta tes yang m em iliki jaw aban salah pada

(8)

p : proporsi peserta tes yang m enjaw ab benar pada butir soal

q : 1 - p

St : standar deviasi seluruh skor tes

K orelasi

biserial

secara m atem atis dinyatakan dengan rumus sebagai

berikut.

M

- M

t p

dengan keterangan

rbis

adalah koefisien korelasi

biserial, y

adalah ordinat p

dalam distribusi norm al, sedangkan sim bol lain sama dengan keterangan

sebelumnya. N ilai korelasi

point biserial

selalu lebih rendah dibanding dengan

nilai korelasi

biserial.

H ubungan antara keduanya dinyatakan dengan rumus:

rpbis rb is ■

i

---v p . q

3. Efektivitas Distraktor

Soal pilihan ganda perlu m em iliki pengecoh, yaitu jaw aban yang tidak bernilai benar. Pengecoh perlu dibuat sedem ikian rupa sehingga m enarik perhatian peserta tes yang belum m em iliki konsep yang baik terhadap m ateri yang diujikan. A llen dan Y en (1979) m enyatakan bahw a pengecoh yang baik m inim um berindeks 0,1 yang berupa koefisien korelasi point biserial, bernilai p o sitif untuk kunci jaw aban dan bernilai negatif untuk pengecoh.

4. Kesalahan Pengukuran

K esalahan Pengukuran

(Standard Error o f Measurement,

SEM ) m em bantu

(9)

skor peserta tes. K esalahan pengukuran dihitung dengan rum us sebagai berikut (B ahrul H ayat, dkk., 1999):

°

e_{= ° x V 1 — p xx'}

dengan keterangan

ox

adalah standar deviasi dari skor total dan p x x ' adalah

koefisien reliabilitas tes.

5. Reliabilitas Tes

R eliabilitas tes dapat diartikan sebagai keajegan atau konsistensi hasil pengukuran atau hasil tes yang dilakukan pada w aktu yang berbeda pada subjek yang sama. A llen dan Y en (1979) m enyatakan bahw a tes disebut reliabel jik a skor am atan m em punyai korelasi yang tinggi dengan skor yang sebenarnya. M ereka ju g a m enyatakan bahw a reliabilitas m erupakan koefisien korelasi antara dua skor

am atan yang diproleh dari hasil pengukuran m enggunakan tes yang paralel.

Reliabilitas suatu tes dapat dihitung dengan beberapa cara dan form ula. Cara atau form ula belah dua, alfa (a ) Cronbach, G uttm an, dan paralel dapat digunakan. N ilai hasil perhitungan dari form ula tersebut sering dikatakan sebagai koefisien reliabilitas. M ehrens dan Lehm ann (1973) m enyatakan bahw a m eskipun tidak ada ketentuan um um , tetapi secara luas dapat diterim a bahw a untuk tes yang digunakan untuk m em buat keputusan secara perorangan harus m em iliki koefisien reliabilitas m inim al 0,85.

K eterbatasan pada teori tes klasik adalah adanya sifat

group dependent

dan

item dependent

(H am bleton, Swam inathan, & Rogers, 1991: 2-5), ju g a indeks

daya pem beda, tingkat kesulitan, dan koefisien reliabilitas tes ju g a tergantung kepada peserta tes yang m engerjakan tes tersebut.

(10)

Untuk m engatasi kelem ahan-kelem ahan yang ada pada teori tes klasik, para ahli pengukuran m encari m odel alternatif. H am bleton, Sw am inathan, & Rogers (1991: 2-5) serta H ulin, D rasgow , & Parsons (1983), m enyatakan seharusnya m odel alternatif ini m em iliki sifat : (a) statistik butir tidak tergantung pada kelom pok subjek, (b) skor tes dapat m enggam barkan kem am puan subjek, (c) m odel dinyatakan dalam tingkatan butir, tidak dalam tingkatan tes, d) m odel tidak m em erlukan tes paralel untuk m enghitung koefisien reliabilitas, dan e) m odel m enyediakan ukuran yang tepat untuk setiap skor kem am puan. M odel alternatif

ini adalah m odel pengukuran yang disebut dengan teori respons butir

(Item

Response Theory).

B. Teori Respons Butir

H am bleton, Swam inathan, & Rogers (1991: 2-5) m enyatakan bahw a teori respons butir didasarkan pada dua buah postulat, yaitu : (a) prestasi subjek pada suatu butir soal dapat diprediksikan dengan seperangkat faktor yang disebut

kem am puan laten

(latent traits),

dan (b) hubungan antara prestasi subjek pada

suatu butir soal dan perangkat kem am puan yang m endasarinya sesuai dengan

grafik fungsi naik m onoton tertentu, yang disebut kurva karakteristik butir

(item

characteristic curve, ICC).

K urva karakteristik butir ini m enggam barkan bahw a

sem akin tinggi level kem am puan peserta tes, sem akin m eningkat pula peluang m enjaw ab benar suatu butir.

A da tiga m odel logistik dalam teori respons butir, yaitu m odel logistik satu param eter (1 PL), m odel logistik dua param eter (2 PL), dan m odel logistik tiga param eter (3 PL). Perbedaan dari ketiga m odel tersebut terletak pada banyaknya

(11)

param eter yang digunakan dalam m enggam barkan karakteristik butir dalam m odel yang digunakan. Param eter-param eter yang digunakan tersebut adalah indeks

kesukaran, indeks daya beda butir dan indeks tebakan semu

(pseudoguessing).

Sesuai dengan nam anya, m odel logistik tiga param eter ditentukan oleh tiga karakteristik butir yaitu indeks kesukaran butir soal, indeks daya beda butir, dan

indeks tebakan sem u (

pseudoguessing

). D engan adanya indeks tebakan sem u pada

m odel logistik tiga param eter, m em ungkinkan subjek yang m em iliki kem am puan rendah m em punyai peluang untuk m enjaw ab butir soal dengan benar. Secara m atem atis, m odel logistik tiga param eter dapat dinyatakan sebagai berikut (H am bleton, & Sw am inathan, 1985 : 49; H am bleton, Sw am inathan, & Rogers, 1991: 17).

( 1 - c . ) e D a i ( 6 - b i)

^ ( 0 ) = Q + 1 + gDai(6-6i) K eterangan :

6

: tingkat kem am puan

(ability)

peserta tes

P (6) : probabilitas peserta tes yang m em iliki kem am puan 6 dapat m enjaw ab

butir i dengan benar

ai

: indeks daya pem beda

bi

: indeks kesukaran butir ke-i

ci

: indeks tebakan sem u butir ke-i

e

: bilangan natural yang nilainya m endekati 2,718

(12)

K urva karakteristik butir soal yang dianalisis dengan m odel 3 param eter logistik yang m em iliki a = 1,00; b = 0,50; dan c = 0,13 ditunjukkan pada G am bar 1. G am bar ini m enunjukkan bahw a probabilitas m enjaw ab benar tidak beraw al dari 0, tetapi beraw al dari 0,13. Jadi jaw aban yang sifatnya tebakan m em punyai kem ungkinan benar 13,0%. D aya beda pada kurva karakteristik butir ditunjukkan dengan kem iringan grafik yang ada. Sem akin vertikal kurva karakteristik suatu butir soal, berarti butir soal tersebut sem akin bisa m em bedakan peserta pandai atau kurang pandai.

</> c o Q. CO 0> cr <£>

o °

1 5

.Q_ro

p d

l l l I l

-4 -2 0 2 4

Achievem ent Index (Theta)

G am bar 1. K urva K arakteristik B utir Soal dengan a = 1,00; b = 0,50; dan c = 0,13

M odel 2 param eter dan 1 param eter m erupakan bagian dari m odel 3 param eter. M odel 2 param eter m erupakan kasus khusus dari m odel 3 param eter, yakni ketika c = 0. M odel 1 param eter m erupakan kasus khusus dari m odel 2 param eter, yakni ketika a = 1 atau a m erupakan tetapan untuk keseluruhan butir

(13)

tes. M odel 2 param eter logistik secara m atem atika dapat dirum uskan sebagai

sedagkan m odel 1 param eter logistik rumus m atem atikanya adalah sebagai

Estim asi param eter dapat dilakukan dengan m enggunakan bantuan program kom puter. N ilai-nilai indeks param eter butir dan kem am puan peserta m erupakan hasil estim asi. K arena m erupakan hasil estim asi, m aka kebenarannya bersifat probabilistik dan tidak terlepaskan dengan kesalahan pengukuran. Dalam teori respons butir, kesalahan pengukuran standar

(Standard Error o f

Measurement, SE)

berkaitan erat dengan fungsi inform asi.

Fungsi inform asi dengan

SE

m em punyai hubungan yang berbanding terbalik kuadratik, sem akin besar fungsi inform asi m aka

SE

sem akin kecil atau sebaliknya (H am bleton, Swam inathan, & Rogers, 1991, 94). Jika nilai fungsi inform asi dinyatakan dengan

I (

0 ) , nilai estim asi SE dinyatakan denganSE (0),

dan

N

adalah jum lah butir yang ada, hubungan keduanya m enurut H am bleton,

Swam inathan, & Rogers (1991 : 94) dan B aker (2001, 119) dinyatakan dengan

C. Kesimpulan

Teori tes klasik punya kelem ahan pada

group dependent

dan

item

dependent

. Ini berarti indeks daya pem beda, tingkat kesulitan, dan koefisien

berikut:

eDai(9-bi)

berikut:

g (0

b{)

(14)

reliabilitas tes tergantung kepada peserta tes yang m engerjakan tes tersebut, selain dipengaruhi oleh soal atau butir soal yang ada. K arena itu indeks daya pem beda, tingkat kesulitan, dan koefisien reliabilitas tes berbeda jik a soal yang sama dikerjakan oleh dua kelom pok sisw a yang berbeda, m isalnya kelom pok siswa yang pandai dan kelom pok sisw a yang kurang pandai.

Teori respons butir m engatasi m asalah tersebut. M aksudnya, hasil perhitungan indeks kesukaran butir soal, indeks daya beda butir, dan indeks tebakan sem u (

pseudoguessing

) akan m enghasilkan angka yang sam a m eskipun diterapkan pada kelom pok sisw a yang berbeda. Tetapi karena indeks param eter butir dan kem am puan peserta m erupakan hasil estim asi, m aka kebenarannya bersifat probabilistik dan m engandung kesalahan pengukuran. Tetapi karena bebas dari

group dependent

dan

item dependent,

teori respons butir dapat digunakan untuk m engetahui karakteristik soal ata butir soal secara lebih m eyakinkan dibanding dengan teori tes klasik.

(15)

DAFTAR PUSTAKA

A llen, M. J & Yen, W . M. (1979).

Introduction to measurement theory.

Belm ont: W adsw orth.

Bahrul H ayat, Sum arno S. Pranata, dan H erw indo H aribow o. (1999).

Manual item

and test analysis (ITEMAN).

Jakarta: Pusbang Sisjian Depdikbud.

Ham bleton, R.K. & Swam inathan, H. (1985).

Item response theory.

Boston, MA: K luw er Inc.

H am bleton, R.K ., Swam inathan, H., & Rogers, H.J. (1991).

Fundamental o f item

response theory.

N ew bury Park, CA: Sage Publication Inc.

H ulin, C.L., D rasgow , F. & Parsons, C.K. (1983).

Item response theory:

Application to psychological measurement.

H om ew ood, IL: D ow Jones-

Irwin.

M ehrens, W . A. & Lehm ann, I. J. (1973).

Measurement and evaluation in

(1)

(Item

Response Theory).

B. Teori Respons Butir

(latent traits),

dan (b) hubungan antara prestasi subjek pada suatu butir soal dan perangkat kem am puan yang m endasarinya sesuai dengan grafik fungsi naik m onoton tertentu, yang disebut kurva karakteristik butir

(item

characteristic curve, ICC).

K urva karakteristik butir ini m enggam barkan bahw a sem akin tinggi level kem am puan peserta tes, sem akin m eningkat pula peluang m enjaw ab benar suatu butir.

(2)

param eter yang digunakan dalam m enggam barkan karakteristik butir dalam m odel yang digunakan. Param eter-param eter yang digunakan tersebut adalah indeks kesukaran, indeks daya beda butir dan indeks tebakan semu

(pseudoguessing).

Sesuai dengan nam anya, m odel logistik tiga param eter ditentukan oleh tiga karakteristik butir yaitu indeks kesukaran butir soal, indeks daya beda butir, dan indeks tebakan sem u (

pseudoguessing

). D engan adanya indeks tebakan sem u pada m odel logistik tiga param eter, m em ungkinkan subjek yang m em iliki kem am puan rendah m em punyai peluang untuk m enjaw ab butir soal dengan benar. Secara m atem atis, m odel logistik tiga param eter dapat dinyatakan sebagai berikut (H am bleton, & Sw am inathan, 1985 : 49; H am bleton, Sw am inathan, & Rogers, 1991: 17).

( 1 - c . ) e D a i ( 6 - b i)

^ ( 0 ) = Q + 1 + gDai(6-6i) K eterangan :

6

: tingkat kem am puan

(ability)

peserta tes

P (6) : probabilitas peserta tes yang m em iliki kem am puan 6 dapat m enjaw ab butir i dengan benar

ai

: indeks daya pem beda

bi

: indeks kesukaran butir ke-i

ci

: indeks tebakan sem u butir ke-i

e

: bilangan natural yang nilainya m endekati 2,718

(3)

</> c o Q. CO 0> cr <£>

o ° <D

0 1 5 .Q_ro n

p d

l l l I l

-4 -2 0 2 4

Achievem ent Index (Theta)

G am bar 1. K urva K arakteristik B utir Soal dengan a = 1,00; b = 0,50; dan c = 0,13

(4)

tes. M odel 2 param eter logistik secara m atem atika dapat dirum uskan sebagai

sedagkan m odel 1 param eter logistik rumus m atem atikanya adalah sebagai

(Standard Error o f

Measurement, SE)

berkaitan erat dengan fungsi inform asi.

Fungsi inform asi dengan

SE

m em punyai hubungan yang berbanding terbalik kuadratik, sem akin besar fungsi inform asi m aka

SE

sem akin kecil atau sebaliknya (H am bleton, Swam inathan, & Rogers, 1991, 94). Jika nilai fungsi inform asi dinyatakan dengan

I (

0 ) , nilai estim asi SE dinyatakan denganSE (0), dan

N

adalah jum lah butir yang ada, hubungan keduanya m enurut H am bleton, Swam inathan, & Rogers (1991 : 94) dan B aker (2001, 119) dinyatakan dengan

C. Kesimpulan

Teori tes klasik punya kelem ahan pada

group dependent

dan

item

berikut:

eDai(9-bi)

berikut:

g (0

b{)

(5)

Teori respons butir m engatasi m asalah tersebut. M aksudnya, hasil perhitungan indeks kesukaran butir soal, indeks daya beda butir, dan indeks tebakan sem u (

pseudoguessing

group dependent

dan

item dependent,

teori respons butir dapat digunakan untuk m engetahui karakteristik soal ata butir soal secara lebih m eyakinkan dibanding dengan teori tes klasik.

(6)

DAFTAR PUSTAKA

A llen, M. J & Yen, W . M. (1979).

Introduction to measurement theory.

Belm ont: W adsw orth.

Bahrul H ayat, Sum arno S. Pranata, dan H erw indo H aribow o. (1999).

Manual item

and test analysis (ITEMAN).

Jakarta: Pusbang Sisjian Depdikbud.

Ham bleton, R.K. & Swam inathan, H. (1985).

Item response theory.

Boston, MA: K luw er Inc.

H am bleton, R.K ., Swam inathan, H., & Rogers, H.J. (1991).

Fundamental o f item

response theory.

N ew bury Park, CA: Sage Publication Inc.

H ulin, C.L., D rasgow , F. & Parsons, C.K. (1983).

Item response theory:

Application to psychological measurement.

H om ew ood, IL: D ow Jones- Irwin.

M ehrens, W . A. & Lehm ann, I. J. (1973).

Measurement and evaluation in

education and psychology

. N ew York: H old R inehart and W iston.