B. Analisis Karakteristik Psikometri
Alat tes yang efektif dan bermanfaat tergantung kepada kualitas aitem yang terdapat di dalam alat tes tersebut Kumar, 2009. Hal ini sesuai dengan yang
dikatakan oleh Anwar 2006 bahwa kualitas tes bergantung kepada kualitas aitem yang menyusunnya yang dapat diketahui melalui beberapa parameter diantaranya
adalah, taraf kesukaran aitem, daya pembeda aitem dan untuk tes objektif jawaban selain kunci haruslah dapat berfungsi secara efektif efektivitas distraktor.
1. Indeks Kesukaran Aitem
a. Pengertian Indeks Kesukaran Aitem
Indeks kesukaran aitem adalah proporsi jumlah subjek yang menjawab benar pada suatu aitem berbanding jumlah subjek yang menjawab pada aitem tersebut
Azwar, 2007. Hal ini sesuai dengan yang dikatakan oleh Tate dalam Kumar, 2009 indeks kesukaran aitem dapat diukur dengan mengetahui proporsi jumlah subjek yang
menjawab aitem dengan benar dengan jumlah subjek yang menjawab aitem tersebut.
Berdasarkan dari pengertian ini dapat dilihat bahwa indeks kesukaran aitem sama dengan nilai rata-rata subjek dalam kelompok. Hal ini sesuai dengan yang dikatakan
Suryabrata 2005 bahwa presentase subjek yang menjawab benar suatu aitem itu sama dengan nilai rata-rata kelompok subjek yang dites, karena itu indeks kesukaran
aitem sering juga disebut indeks kesukaran rata-rata. Indeks kesukaran aitem ditentukan oleh seberapa banyak peserta tes berhasil
menjawab aitem dengan benar. Semakin banyak peserta tes menjawab dengan benar,
Universitas Sumatera Utara
semakin mudah aitem tersebut. Begitu juga sebaliknya semakin sedikit peserta menjawab dengan benar, maka semakin sulit aitem tersebut. Indeks kesukaran aitem
disimbolkan dengan
p
. Rumusan ini dituangkan dalam formula. p =
6 Keterangan: p = Indeks kesukaran aitem
ni = Banyak peserta tes yang menjawab benar N = Banyak peserta tes yang menjawab aitem
Indeks kesukaran aitem dapat membantu dalam menyusun aitem, aitem mana yang harus diletakkan di awal, di tengah hingga di akhir Kumar, 2009. Pernyataan
ini didukung oleh Murphy Davidshofer 2003 disarankan untuk menyusun aitem- aitem dalam tes secara sistematis, dengan menempatkan aitem-aitem berdasarkan
tingkat kesukarannya, mulai dari aitem yang paling mudah hingga yang paling sulit. Sehingga pola penyusunan aitem-aitem dalam tes dimulai dari aitem dengan harga
p
yang paling tinggi hingga aitem dengan harga
p
yang paling rendah Murphy Davidshofer, 2003.
b. Analisis Indeks Kesukaran Aitem Tes disusun bertujuan untuk melihat perbedaan individu sehingga jika tidak
ada seorang pun yang menjawab pertanyaan dengan benar, dalam artian soal sangat susah
p
= 0 bahkan sebaliknya jika soal sangat mudah sehingga semua dapat menjawab pertanyaan dengan benar
p
= 1 tentu tujuan alat tes tidak dapat dipenuhi Murphy Davidshofer, 2003.
Universitas Sumatera Utara
Menurut Azwar 2005, tingkat kesukaran yang terbaik bergantung pada tujuan dari tes tersebut, untuk tes prestasi yang bertujuan untuk evaluasi formatif
misalnya, tidak jarang diperlukan aitem-aitem yang mudah atau aitem-aitem dengan harga p tinggi, namun demikian untuk tes yang bertujuan untuk proses seleksi masuk,
terlebih dalam tes masuk yang bertujuan untuk proses pendidikan, harus diusahakan tes yang memiliki harga p yang rendah atau aitem yang sulit, sehingga individu yang
dinyatakan lulus selanjutnya adalah individu yang benar-benar menguasai serta mampu untuk mengikuti proses pendidikan selanjutnya Suryabrata, 2005.
Tabel 1. Kategorisasi Batasan Nilai p
No P
Kategori 1
P0,3 Sulit
2 0.3P0,7
Sedang
3 P0,7
Mudah
Umumnya pada penyusunan instrumen tes disarankan untuk menggunakan aitem dengan taraf kesukaran sedang p
= 0,50 tidak disarankan untuk menggunakan aitem yang memiliki taraf kesukaran ekstrim, baik yang terlalu tinggi maupun terlalu
rendah. Aiken 2008 menambahkan bahwa nilai p juga dipengaruhi oleh jumlah
pilihan jawaban.
Tabel 2. Kategorisasi Batasan Nilai p Berdasarkan
Jumlah Pilihan Jawaban
No Jumlah Pilihan
Jawaban P
1 2
0,85
2 3
0,77
3 4
0,74
4 5
0,60
Universitas Sumatera Utara
5 Jawaban terbuka
0,50
Nilai p dipengaruhi oleh jumlah pilihan jawaban, Sehingga akan berbeda indeks kesukaran aitem yang memiliki dua pilihan jawaban dengan aitem yang
memiliki tiga atau lebih pilihan jawaban, karena jika hanya ada dua pilihan jawaban berarti hanya terdapat dua kemungkinan apakah subjek menjawab benar atau salah,
sehingga seharusnya indeks kesukaran aitem bernilai tinggi. 2. Indeks Daya Beda Aitem
a. Pengertian Indeks Daya Beda Aitem Daya beda aitem merupakan kemampuan aitem dalam membedakan antara
individu yang memiliki atribut psikologis yang diukur dengan individu yang tidak memiliki atribut psikologis yang diukur sehingga dalam penelitian ini daya beda
aitem pada IST subtes SE dapat diartikan sebagai kemampuan aitem dalam membedakan individu yang memiliki pengetahuan umum dengan individu yang tidak
memiliki pengetahuan umum. Aitem yang memiliki indeks daya beda yang baik adalah aitem dapat dijawab
benar oleh sebagian besar kelompok subjek kemampuan tinggi, dan dijawab salah oleh sebagian besar kelompok subjek kemampuan rendah jadi kesimpulannya indeks
daya beda aitem merupakan suatu harga yang menunjukkan perbedaan proporsi penjawab aitem dengan benar antara kelompok yang memiliki kemampuan tinggi
dengan kelompok yang memiliki kemampuan rendah.
Universitas Sumatera Utara
Daya beda aitem dilakukan untuk memenuhi tujuan pengukuran psikologis yaitu untuk mengukur perbedaan individu atau reaksi individu yang sama pada situasi
yang berbeda Anastasi Urbina, 1997. Murphy dan Davidshofer 2003 mengatakan bahwa aitem yang baik
seharusnya dapat membedakan kelompok individu yang mampu mengerjakan tes dengan individu yang tidak, atau dengan kata lain antara kelompok yang memiliki
kemampuan tinggi dengan kelompok yang memiliki kemampuan rendah. Indeks daya beda aitem disimbolkan dengan d.
d = -
7 Keterangan: nit = Jumlah peserta dari kelompok tinggi yang menjawab aitem
dengan benar Nt = Jumlah peserta dari kelompok tinggi
nir = Jumlah peserta dari kelompok rendah yang menjawab aitem dengan benar
Nr = Jumlah peserta dari kelompok rendah
Karena = p, maka d dapat juga diformulasikan dengan:
d = pt-pr 8
Keterangan: pt = Indeks kesukaran aitem kelompok tinggi pr = Indeks kesukaran aitem kelompok rendah
Universitas Sumatera Utara
Menurut Murphy dan Davidshofer 2003 ada tiga cara statsistik yang dapat digunakan untuk mengestimasi daya beda aitem, yaitu:
1. Metode Kelompok Ekstrim
Metode kelompok ekstrim dapat digunakan untuk mengukur daya beda aitem pada kelompok yang besar. Daya beda aitem dapat dihitung dengan cara membagi
kelompok menjadi dua, kelompok tinggi yakni kelompok yang memiliki skor yang tinggi 25-35 nilai tertinggi didalam kelompok dan kelompok rendah
yakni kelompok yang memiliki nilai yang rendah 25-35 nilai terendah dalam
kelompok. Aitem yang memiliki indeks daya beda aitem yang baik akan dijawab benar oleh kelompok tinggi dan dijawab salah oleh kelompok rendah.
2. Korelasi aitem-total
Korelasi aitem-total memberikan informasi tentang apakah aitem mengukur hal yang sama dengan tes, korelasi aitem-total dapat dihitung menggunakan korelasi
point biserial
. Korelasi
point biserial
digunakan jika variabel kontinu dihubungkan dengan variabel dikotomi yang sesungguhnya. Contoh variabel dikotomi
sesungguhnya adalah benar-salah, psikotik-normal, buta warna-normal Kumar, 2009.
Korelasi
point biserial
yang bernilai positif menunjukkan bahwa aitem dan tes mengukur hal yang sama, nilai mendekati nol menunjukkan bahwa bahwa aitem tidak
memiliki indeks daya beda yang baik sehingga kelompok tinggi menjawab pertayaan
dengan salah dan kelompok rendah menjawab pertanyaan dengan benar. Nilai negatif
Universitas Sumatera Utara
menunjukkan bahwa aitem tidak mengukur hal yang sama dengan alat tes. Korelasi
poin biserial
diformulasikan sebagai berikut: 9
Keterangan:
bis
= Korelasi poin biserial
µ
+
=
Rata-rata skor kriteria bagi individu yang menjawab jawaban dengan benar
µ =
Rata-rata skor kriteria kelompok Standar deviasi skor kriteria kelompok
P = Indeks Kesulitan aitem
Q = 1-P
3. Korelasi inter-aitem
Korelasi inter-aitem digunakan untuk memahami pengukuran daya beda aitem. Korelasi inter-aitem tidak menjelaskan mengapa beberapa aitem menunjukkan
nilai yang tinggi ataupun rendah karena sangat jelas bahwa aitem yang memiliki nilai korelasi aitem-total yang positif akan menunjukkan nilai yang positif juga pada
kebanyakan aitemnya, namun korelasi aitem-total tidak dapat menjelaskan mengapa korelasi aitem total dapat bernilai negatif dan dalam hal ini dapat dijelaskan dengan
menggunakan korelasi inter-aitem. Korelasi inter-aitem dapat membantu dalam memahami mengapa beberapa
aitem gagal dalam membedakan subjek yang memiliki kemampuan dengan subjek
Universitas Sumatera Utara
yang tidak memiliki kemampuan, dalam artian kelompok tinggi dapat menjawab dengan salah dan subjek dari kelompok rendah dapat menjawab dengan benar.
Korelasi inter-aitem yang bernilai rendah dapat memiliki dua arti, kemungkinan pertama adalah aitem tidak mengukur hal yang sama dengan tes,
sehingga aitem harus dibuang atau dibuat ulang, kemungkinan kedua adalah aitem memang mengukur atribut yang berbeda dengan tes dikarenakan tes memang disusun
untuk mengukur dua atribut yang berbeda. Daya beda aitem dalam penelitian dapat diestimasi dengan korelasi aitem total
dengan menggunakan korelasi
point biserial
. b. Analisis Indeks Daya Beda Aitem
Indeks daya beda aitem secara matematis akan berkisar mulai dari -1 sampai dengan +1, namun demikian hanya harga d yang bernilai positif saja yang memiliki
arti dalam analisis aitem. Harga d yang berada disekitar 0 menunjukkan bahwa aitem yang
bersangkutan mempunyai daya beda yang rendah sedangkan harga d yang negatif menunjukkan bahwa aitem yang bersangkutan tidak berguna sama sekali bahkan bisa
menyesatkan. Indeks daya beda aitem yang ideal adalah yang mendekati angka 1, semakin
besar indeks daya beda semakin mendekati 1 berarti aitem tersebut mampu membedakan antara individu yang menguasai materi yang diujikan dan mereka yang
tidak menguasainya, semakin kecil daya beda aitem semakin mendekati 0 berarti semakin tidak jelaslah fungsi aitem yang bersangkutan dalam membedakan mana
Universitas Sumatera Utara
subjek yang menguasai materi yang diujikan dan subjek yang tidak tahu apa-apa Azwar, 2007.
Ebel dalam dalam Azwar, 2007 terdapat suatu panduan dalam evaluasi indeks daya beda aitem, yaitu :
Tabel 3. Evaluasi Indeks Daya Beda Aitem
Indeks Daya Beda
Evaluasi 0,4 atau lebih
Bagus sekali
0,3 - 0,39 Lumayan bagus, tidak membutuhkan revisi
0,2 – 0,29
Belum memuaskan, perlu revisi
Kurang dari 0,20 Jelek dan harus dibuang
Thorndike dalam Azwar, 2007 bahwa dalam proses seleksi aitem, aitem- aitem yang memiliki nilai daya beda aitem di atas 0,50 akan langsung dianggap baik
sedangkan aitem-aitem dengan indeks daya beda di bawah 0,20 dapat langsung dibuang dan dianggap jelek.
3. Efektivitas Distraktor a. Pengertian Efektivitas Distraktor
Aitem yang baik harus memiliki dua karakteristik yaitu: pertama individu yang mengetahui jawaban dari pertanyaan yang diajukan haruslah menjawab
pertanyaan tersebut dengan benar, kedua individu yang tidak mengetahui jawaban dari pertanyaan yang diajukan haruslah memilih pilihan jawaban secara acak
Universitas Sumatera Utara
Murphy Davidshofer, 2003, jadi dapat disimpulkan karakteristik kedua adalah efektivitas distraktor.
Efektivitas distraktor diperiksa untuk melihat apakah semua distraktor atau semua pilihan jawaban yang bukan kunci jawaban telah berfungsi sebagaimana
mestinya, yaitu apakah distraktor-distraktor tersebut telah dipilih lebih banyak atau semua individu dari kelompok rendah sedangkan individu dari kelompok tinggi
hanya sedikit atau tidak ada yang memilihnya. Pengaruh yang jelas ketika distraktor yang digunakan tidak popular adalah tingkat kesukaran aitem menjadi rendah.
b. Analisis Efektivitas Distraktor Terdapat dua kemungkinan jika jumlah orang yang menjawab suatu distraktor
melebihi jumlah yang diharapkan. Pertama, kemungkinannya bahwa pilihan subjek tersebut menunjukkan pengetahuan parsial. Artinya subjek mengetahui bahwa
distraktor yang dipilihnya tersebut juga berkaitan dengan pengetahuan yang dipertanyakan. Kedua, kemungkinan yang ditakutkan adalah aitem tersebut
merupakan aitem buruk yang menjebak. Artinya, jika salah satu distraktor lebih dikenal oleh subjek yang memiliki pengetahuan baik mengenai domain ukur dan jika
identifikasi dari respon benar merupakan jawaban yang kurang dikenal atau tidak jelas maka aitem ini tidak valid mengukur kawasan ukurnya. Kehadiran aitem dengan
distraktor yang sangat tidak asing bagi subjek memiliki reliabilitas dan validitas tes yang rendah Murphy Davidshofer, 2003. Jumlah subjek yang diharapkan
menjawab pertanyaan adalah perbandingan anatara subjek yang menjawab salah dengan jumlah distraktor. Efektivitas distraktor dapat dilihat dari dua kriteria:
Universitas Sumatera Utara
1. Distraktor dipilih oleh individu dari kelompok rendah
2. Pemilih distraktor yang tersebar relatif proporsional pada masing-masing
distraktor yang ada. Penelitian ini melihat efektivitas distraktor berdasarkan distraktor yang dipilih
oleh individu dari kelompok rendah, dan distraktor yang menyebar secara proporsional pada masing-masing distraktor yang ada.
4. Reliabilitas Alat Ukur a. Pengertian Reliabilitas
Reliabilitas merupakan penerjemahan dari kata
reliability
yang berasal dari kata
rely
dan
ability
. Ada banyak istilah yang digunakan untuk menyatakan reliabilitas, seperti keterpercayaan, keterandalan, keajegan, kestabilan, konsistensi
dan sebagainya, namun pada intinya konsep reliabilitas memiliki makna sejauh mana hasil suatu pengukuran dapat dipercaya Azwar, 2007, karena konsepsi mengenai
reliabilitas berkaitan dengan indeks konsistensi antara dua perangkat skor tes, maka formula reliabilitas selalu dinyatakan dalam bentuk koefisien korelasi Azwar, 2007.
Menurut Suryabrata 2005 reliabilitas alat ukur menunjukkan sejauh mana hasil pengukuran dengan alat tersebut dapat dipercaya, yang mana hal ini ditunjukkan
oleh taraf konsistensi skor yang diperoleh para subjek yang diukur dengan alat yang sama atau minimal setara, dalam kondisi yang berbeda.
Universitas Sumatera Utara
Crocker dan Algina 2005 menjelaskan bahwa pada dasarnya reliabilitas menggambarkan indeks konsistensi, yaitu :
”a reliability term refers to the degree to which individuals deviation
scores, or z-scores, remain relatively consistent over repeated
administration of the same test or alternate test forms”. Berdasarkan beberapa definisi di atas, dapat disimpulkan bahwa reliabilitas
menunjukkan pada indeks konsistensi penyimpangan skor individu. Menurut Kumar 2009 ada dua pengertian reliabilitas yang hampir mirip yaitu:
1. Reliabilitas adalah proporsi varians skor murni dengan varians skor tampak
2. Reliabilitas adalah proporsi varians eror skor murni dengan varians eror skor
tampak. b. Bentuk Estimasi Reliabilitas
Teori Tes Klasik mengasumsikan bahwa varians skor observasi kelompok orang sama dengan varians skor sesungguhnya ditambah dengan varians karena eror
pengukuran sistematis, karena varians skor sesungguhnya tidak dapat langsung dihitung, reliabilitas di estimasi dengan menganalisa dampak variasi pada skor
penyelenggara dan isi tes pada skor yang diobservasi. Beberapa metode untuk mengesitimasi reliabilitas:
1. Pendekatan tes ulang Pendekatan ini dilakukan dengan cara menyajikan tes dua kali pada suatu
kelompok yang sama yang diantara penyajian kedua tes tersebut diberi rentang waktu, sehingga akan diperoleh dua distribusi skor dari kelompok tersebut.
Universitas Sumatera Utara
Komputasi koefisien korelasi antara kedua distribusi skor kelompok tersebut akan menghasilkan koefisien reliabilitas.
Mengingat bahwa dalam prakteknya pendekatan ini mengandung kelemahan yaitu kondisi subjek pada tes kedua tidak lagi sama dengan kondisi subjek pada tes
pertama baik dari proses belajar, perubahan motivasi, pengalaman, sehingga pendekatan ini lebih baik digunakan bila objek ukur berupa keterampilan, terutama
keterampilan fisik. 2. Pendekatan tes paralel
Pendekatan reliabilitas bentuk paralel dilakukan dengan memberikan sekaligus dua bentuk tes yang paralel kepada sekelompok subjek, dalam
pelaksanaannya kedua tes yang paralel tersebut dapat digabungkan sehingga seakan- akan merupakan satu bentuk tes, setelah dijawab subjek barulah aitem-aitem masing-
masing tes semula dipisahkan, sehingga diperoleh dua distribusi skor. Keuntungan cara ini adalah subjek tidak merasa berat untuk menjawab pertanyaan dalam tes
sehingga dapat mengurangi efek
carry-over
namun kelemahan pendekatan ini adalah sulitnya menyusun perangkat tes yang paralel.
3. Pendekatan konsistensi internal
Seperangkat tes diberikan kepada sekelompok subjek satu kali sehingga diperoleh satu distribusi skor tes dari kelompok subjek tersebut. Prosedur analisis
reliabilitasnya diarahkan pada analisis terhadap aitem-aitem atau terhadap kelompok- kelompok aitem dalam tes itu sehingga perlu dilakukan pembelahan tes menjadi
beberapa kelompok aitem yang disebut belahan tes. Membelah tes prinsipnya adalah
Universitas Sumatera Utara
mengusahakan agar antar belahan memiliki jumlah aitem sama banyak, taraf kesukaran seimbang, isi sebanding, dan memenuhi ciri-ciri paralel . Berikut beberapa
pilihan cara untuk membelah tes menjadi lebih dari dua bagian. 1.
Pembelahan cara random Membelah tes menjadi dua bagian secara random dapat dilakukan dengan cara
undian sederhana guna menentukan aitem-aitem nomor berapa sajakah yang dimasukkan menjadi belahan pertama dan yang mana menjadi belahan kedua.
Pembelahan secara random hanya boleh dilakukan bila tes yang akan dibelah berisi aitem-aitem yang homogen baik dari segi konten maupun segi taraf kesukaran aitem,
namun jika aitem tersebut heterogen dapat juga menggunakan cara pembelahan ini asalkan aitem tersebut jumlahnya sangat besar.
2. Pembelahan gasal-genap
Pembelahan gasal-genap dilakukan dengan cara mengelompokkan seluruh aitem yang bernomor urut gasal menjadi belahan pertama dan seluruh aitem yang
bernomor urut genap dijadikan satu kelompok belahan kedua. Cara pembelahan ini selain mudah dilakukan juga dapat menghindari kemungkinan terjadinya
pengelompokkan aitem-aitem tertentu ke dalam salah satu belahan saja. 3.
Pembelahan
matched-random
Subtes Pembelahan dengan cara
matched-random
subtes ditemukan oleh Gulikksen 1950, sebelum melakukan pembelahan tes terlebih dahulu harus dihitung indeks
taraf kesukaran aitem serta korelasi aitem dengan skor total tes, dengan cara ini setiap aitem dalam tes diletakkan pada satu posisi atau titik tertentu dalam grafik
Universitas Sumatera Utara
berdasarkan harga indeks kesukaran aitem dan korelasi antara aitem yang bersangkutan dengan skor tes.
Keuntungan menggunakan pendekatan konsistensi internal adalah, dapat menghindari masalah-masalah yang biasanya ditimbulkan oleh pendekatan tes ulang
dan pendekatan tes paralel. c. Formula Estimasi Reliabilitas Konsistensi Internal
Formula estimasi yang berbeda, walaupun dikenakan pada data yang sama, pada umumnya tidak akan menghasilkan koefisien yang serupa. Beberapa hal yang
berpengaruh terhadap hasil komputasi koefisien reliabilitas adalah: 1.
Perbedaan konsep dan dasar pikiran yang melandasi ide dasar terbentuknya suatu formula.
2. Sifat distribusi skor kelompok subjek.
3. Homogenitas aitem-aitem dalam tes.
4. Homogenitas isi dan varians antar belahan tes.
5. Indikasi yang ditunjukkan oleh hasil teknik perhitungan tertentu.
Berikut beberapa formula estimasi yang dapat digunakan untuk menghitung koefisien reliabilitas:
1. Spearman-Brown
Formula komputasi Spearman-Brown merupakan formula koreksi terhadap koefisien korelasi antara dua bagian tes dan dirumuskan sebagai berikut Azwar,
2005:
Universitas Sumatera Utara
S-B = r
xx’
= 10
Keterangan:
r
xx’
= Koefisien reliabilitas Spearman-Brown
r
12
= Koefisien korelasu antara dua belahan
Formula ini dapat digunakan jika aitem dikotomi ataupun politomi, pembelahan tes dilakukan dengan cara gasal-genap
dan matched-random subtes
dan menghasilkan dua bagian yang paralel satu sama lain dan korelasi antara kedua
belahan paralel tersebut cukup tinggi. 2.
Rulon Rulon 1939 mempersoalkan reliabilitas tes yang dibelah menjadi dua
belahan, jika sekiranya belahan tersebut setara maka secara teori skor subjek pada perangkat belahan pertama dan skor perangkat belahan kedua akan sama. Jika skor-
skor pada kedua perangkat itu tidak sama, maka itu terjadi karena kesalahan pengukuran. Berdasarkan atas pemikiran ini maka diusulkan rumus reliabilitas tes
sebagai berikut Suryabrata, 2005:
r
xx’
= 1- s
d 2
s
x 2
11
Keterangan:
s
d 2
= Varians perbedaan skor kedua belahan
s
x 2
= Varians skor tes d = Perbedaan skor kedua belahan
Universitas Sumatera Utara
Formula ini dapat digunakan jika aitem dikotomi ataupun politomi, belahan tes tidak harus paralel, namun harus memenuhi asumsi τ-
equivalent
. 3.
Koefisien alpha belah dua Formula koefisien alpha untuk estimasi reliabilitas belah dua dirumuskan
sebagai berikut:
r
xx’
= 2
12 Keterangan:
= Varians pada belahan 1 = Varians pada belahan 2
= Varians total skor tes
Formula ini dapat digunakan jika aitem dikotomi ataupun politomi, belahan tes tidak harus paralel, namun harus memenuhi asumsi τ-
equivalent
, aitem-aitem dalam tes haruslah homogen sehingga formula ini tidak bisa digunakan untuk
mengestimasi koefisien reliabilitas alat tes yang mengukur beberapa
trait
. 4.
Koefisien alpha belah lebih dari dua Pembelahan tes tidak hanya terbatas pada membagi tes ke dalam dua belahan
saja. Cara-cara pembelahan dapat diperluas pemakainnya untuk membagi tes menjadi beberapa belahan. Bahkan suatu tes yang akan diestimasi reliabilitasnya dapat dibelah
menjadi bagian-bagian sebanyak jumlah aitemnya sehingga setiap bagian hanya berisi satu aitem saja.
Universitas Sumatera Utara
Tes yang dibelah menjadi lebih dari dua belahan yang masing-masing berisi aitem yang berjumlah sama banyak kita dapat menggunakan formula alpha dengan
rumus:
=
13 Keterangan :
= banyaknya belahan tes = varians belahan
j; j = 1, 2…k = varians skor tes
Formula ini dapat digunakan jika aitem dikotomi ataupun politomi, setiap belahan memiliki aitem yang relatif setara, paralel setidaknya memenuhi asumsi τ-
equivalent,
aitem-aitem dalam tes haruslah homogen sehingga formula ini tidak bisa digunakan untuk mengestimasi koefisien reliabilitas alat tes yang mengukur beberapa
trait.
5. Kuder-Richardson 20 KR-20
KR 20 merupakan rata-rata estimasi reliabilitas dari semua cara belah-dua yang mungkin dilakukan. Koefisien ini juga mencerminkan sejauhmana kesetaraan isi
aitem-aitem dalam tes. Rumusan formula KR-20 adalah: 14
Keterangan : = Banyaknya aitem dalam tes
= Varians skor tes
Universitas Sumatera Utara
p = Proporsi subjek yang mendapat angka 1 pada suatu aitem, yaitu banyaknya subjek yang mendapat angka 1 dibagi oleh
banyaknya seluruh subjek yang menjawab aitem tersebut.
Formula ini dapat digunakan jika aitem dikotomi, jumlah aitem sedikit dan membelahan tes sebanyak jumlah aitem, aitem-aitem dalam tes haruslah homogen
sehingga formula ini tidak bisa digunakan untuk mengestimasi koefisien reliabilitas alat tes yang mengukur beberapa
trait
, dan tingkat kesukaran aitem haruslah bervariasi.
6. Kuder-Richardson 21 KR-21
Perhitungan KR-21 menggunakan rata-rata harga p dari keseluruhan aitem. hal inilah yang membedakan antara KR-20 dengan KR-21. Rumusan formula KR-21
adalah: 15
Keterangan : = Banyaknya aitem dalam tes
= Rata-rata p yaitu, = Varians skor tes
Untuk mempermudah komputasi, formula KR-21 dapat pula dinyatakan sebagai:
16
Universitas Sumatera Utara
Keterangan : M
x
= Harga rata-rata
means
skor tes Formula ini dapat digunakan jika aitem dikotomi, jumlah aitem sedikit dan
membelahan tes sebanyak jumlah aitem Estimasi koefisien reliabilitas pada penelitian ini dilakukan dengan
pendekatan konsistensi internal dengan formula estimasi koefisien reliabilitas yang digunakan adalah KR-20.
d. Interpretasi Koefisien Reliabilitas Reliabilitas merupakan konsistensi performa relatif subjek pada tes-tes yang
diadminstrasikan ulang atau paralel, namun ketidakkonsistenan skor dapat terjadi terutama disebabkan oleh eror yang mempengaruhi performa subjek yang mengikuti
tes.Terdapat dua jenis eror yang mempengaruhi performa subjek, yaitu: 1.
Eror yang sistematik yaitu kecendrungan subjek untuk memperoleh skor yang semuanya tinggi atau sebaliknya semuanya rendah. Eror ini akan secara konsisten
mempengaruhi performa individu dalam mengerjakan tes. Sumber eror ini biasanya berkaitan dengan karakteristik subjek atau alat tes.
2. Eror tidak sistematik yaitu kecendrungan subjek memperoleh skor yang tidak
tetap. Eror ini secara tidak sengaja muncul dan mempengaruhi skor individu. Eror ini bersifat acak. Sumber eror ini seperti kelelahan memori, situasi tes misalnya
suhu ruangan yang terlalu dingin atau terlalu panas, dan suasana hati subjek. Eror yang telah dijelaskan dapat mengakibatkan skor yang diperoleh individu
skor tampak tidak selalu sama dengan skor murni seseorang dalam konteks suatu performansi tertentu, padahal skor murnilah yang mencerminkan kondisi sebenarnya
Universitas Sumatera Utara
dari performansi subjek terhadap kriteria tertentu, oleh karena skor murni tidak dapat diperoleh secara langsung, koefisien reliabilitas merupakan salah satu bentuk
pendekatan yang dapat digunakan untuk mengestimasi nilai ini, melalui koefisien ini dapat diestimasi letak skor murni tersebut dalam suatu wilayah interval tertentu.
Penafsiran terhadap koefisien reliabilitas harus dilakukan melalui penafsiran standard eror pengukuran, dengan rumusan sebagai berikut:
SE
m
= S
x
17 Keterangan: SE
m
= Standar eror pengukuran S
x
= Standar deviasi skor Semakin tinggi koefisien reliabilitas suatu tes, maka kemungkinan kesalahan
yang terjadi akan semakin kecil, jadi tidak ada harga mati dalam koefisien reliabilitas. Tingi rendahnya koefisien reliabilitas sangat bergantung kepada tujuan penerapan tes
Suryabrata, 2005. Murphy dan Davidshofer 2003 menyatakan bahwa reliabilitas yang rendah
dapat diterima jika tes digunakan untuk membuat keputusan awal, tidak untuk keputasan akhir dan tes yang digunakan untuk mengelompokkan individu kedalam
krlompok yang kecil berdasarkan perbedaan yang mencolok. Reliabilitas yang tinggi diperlukan untuk tes yang digunakan untuk membuat
keputusan akhir dan tes yang digunakan untuk mengelompokkan individu kedalam kategori yang beragam yang berdasarkan perbedaan yang kecil antara individu.
Tabel 4.Tingkat Reliabilitas untuk Berbagai Tipe Tes
Universitas Sumatera Utara
Estimasi Reliabilitas
Bentuk Tes
Interpretasi 0.95
Pengukuran eror sebenarnya memiliki efek yang rendah
0.90 Tes Intelegensi
Reliabilitas tinggi-sedang
0.85 0.80
Tes Prestasi
0.75 Tes Pilihan
Ganda Reliabilitas sedang-rendah
0.70 Skala
0.65 Reliabilitas rendah
0.60 Tes Proyektif
0.55 0.50
Skor murni dan eror memiliki efek yang sama dalam pengukuran
Berdasarkan tabel diatas maka IST harus memiliki koefisien reliabilitas sebesar 0.9.
e. Faktor-faktor yang Mempengaruhi Koefisien Reliabilitas Crocker Algina 2005 menjelaskan bahwa ada 3 hal utama yang secara
tidak langsung mempengaruhi tinggi rendahnya koefisien reliabilitas suatu instrumen, yaitu:
1. Homogenitas Kelompok Homogenitas kelompok harus diperhatikan ketika menyusun alat tes karena
dalam suatu kondisi tes, semakin besar homogenitas kelompok berkaitan dengan
trait-trait
tertentu yang diukur maka indeks reliabilitas akan semakin rendah bila dibandingkan dengan kondisi ketika kelompok sampel lebih heterogen.
2. Batasan Waktu dalam Tes
Universitas Sumatera Utara
Tes yang memiliki waktu yang lebih panjang cenderung akan memiliki indeks reliabilitas yang lebih tinggi dibandingkan tes yang memiliki waktu yang lebih
pendek. 3. Panjang Tes
Panjang dari suatu tes sangat bergantung dengan seberapa banyaknya aitem- aitem yang menyusun tes tersebut. Semakin banyak aitem yang memiliki kualitas
baik dalam suatu tes, maka semakin tinggi pula indeks reliabilitas instrumen tersebut.
5. Validitas a. Pengertian Validitas
Validitas mempunyai arti sejauhmana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu alat ukur dapat dikatakan memiliki
validitas yang tinggi apabila alat tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur, yang sesuai dengan maksud dilakukannnya pengukuran
tersebut, sehingga disini tampak bahwa bahwa pengertian validitas juga sangat erat kaitannya dengan tujuan pengukuran, oleh karena itu, tidak ada validitas yang berlaku
umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik, dengan demikian, pernyataan valid
terhadap suatu pengukuran harus diikuti oleh keterangan yang menunjuk kepada tujuan awal pengukuran serta kelompok subjek yang mana Azwar, 2007.
Sisi lain dari pengertian validitas menurut Azwar 2007 adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya mampu
Universitas Sumatera Utara
menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut. Cermat berarti bahwa pengukuran itu dapat
memberikan gambaran mengenai perbedaan yang sekecil-kecilnya di antara subjek yang satu dengan yang lain.
b. Jenis-Jenis Validitas 1.
Content related validation Validitas isi menunjukkan sejauhmana tes yang merupakan seperangkat
aitem-aitem dilihat dari isinya memang mengukur apa yang dimaksudkan untuk diukur sesuai dengan kawasan ukur. Ukuran sejauhmana ini ditentukan berdasar
indeks representatifnya isi tes tersebut bagi isi hal yang akan diukur. Validitas berdasarkan estimasi isi merupakan bentuk validitas yang diestimasi lewat pengujian
terhadap isi tes dengan analisis rasional atau lewat
professional judgement
. 2.
Criterion related validation Validitas berdasar kriteria merupakan validitas yang diperlihatkan oleh
adanya hubungan skor pada tes yang bersangkutan dengan skor suatu criteria, dalam validasi tes berdasar kriteria, umumnya tes yang akkan diuji validitasnya disebut
sebagai prediktor. Prosedur validasi berdasar kriteria menghasilkan dua macam validitas, yaitu :
a. Validitas prediktif Estimasi validitas prediktif sangat penting artinya bila tes yang dimaksud
berfungsi sebagai prediktor bagi performansi diwaktu yang akan datang Azwar, 2005.
Universitas Sumatera Utara
b. Validitas konkuren Estimasi validitas konkuren dilakukan apabila skor tes dan skor kriterianya
dapat diperoleh dalam waktu yang sama. Azwar 2007 mengatakan bahwa sebagian besar faktor kriteria dalam estimasi validitas konkuren ialah skor tes lain
yang biasanya sudah teruji dan terstandar dengan baku. 3.
Construct related validation Ada baiknya diketahui pengertian konstrak terlebih dahulu, Sebelum
membahas tentang validitas konstrak, konstrak psikologis adalah suatu konsep yang dengan kesadaran penuh sengaja diciptakan bagi tujuan ilmiah khusus, dan konsep
adalah merupakan abstraksi yang terbentuk melalui generalisasi dari hal-hal khusus Kerlinger, 1973. Konstrak terdiri dari dua proposisi, yaitu:
1. Definisi dan spesifikasi mengenai suatu konsep secara sistematis dan terencana
sehingga memungkinkan dilakukannya observasi an pengukuran terhadapnya. Dalam hal ini konstrak dapat berupa petunjuk kegiatan-kegiatan atau tindakan
yang diperlukan dalam pengukuran suatu konstrak. 2.
Konstrak tersebut dimasukkan kedalam bagan teori yang dengan berbagai cara akan dikaitkan dengan konstrak-konstrak lain. Dengan kata lain merumuskan
hipotesis yang mengaitkan konstrak baru tersebut dengan konstrak-konstrak lain kedalam jalinan teoritis yang kompak.
Prinsipnya, pengujian kedua proposisi inilah yang menjadi fokus kajian dalam validitas konstrak. Validitas konstrak adalah validitas yang menunjukkan sejauhmana
Universitas Sumatera Utara
suatu tes mengukur
trait
atau konstrak teoretik yang hendak diukurnya Azwar, 2007. Fokus pengujian validitas konstrak tersebut adalah:
1. Apakah data yang dikumpulkan dari alat ukur yang disusun telah mendukung
konstruksi teorinya. 2.
Apakah bukti-bukti empiris yang dikumpulkan dari berbagai pengujian relasi telah mendukung hipotesis dalam bagan teorinya.
Berdasarkan kedua fokus pengujian validitas konstrak tersebut dapat ditarik kesimpulan bahwa fokus pengujian pertama adalah analisis faktor dan fokus
pengujian yang kedua adalah analisis
multitrait multimethode
. 1.
Analisis faktor Analisis faktor merupakan kumpulan prosedur matematik yang kompleks guna
menganalisis hubungan diantara variable-variabel dan menjelaskan hubungan tersebut dalam bentuk kelompok variable yang terbatas yang disebut faktor.
2. Analisis
multitrait multimethode
Campbell dan Fiske dalam Murphy Davidshofer, 2003 menguraikan tentang cara mengukur validitas konstrak dan menjelaskan bahwa jika ingin
mengukur dua konstrak atau lebih menggunakan dua macam metode atau lebih dapat menggunakan pendekatan
multitrait multimethode
. Pendekatan
multitrait multimethode
menghasilkan dua macam validitas, yakni validitas konvergen dan validitas diskriminan. Dasar pemikirannya adalah suatu tes
Universitas Sumatera Utara
harus berkorelasi tinggi dengan variabel-variabel yang secara teori harus berkorelasi tinggi inilah yang disebut validitas konvergen dan tidak berkorelasi dengan variable-
variabel yang secara teori tidak berkorelasi validitas diskriminan. Teknis penerapan pendekatan
multitrait multimethode
adalah sebagai berikut. Pada suatu kesempatan dilakukan pengukuran terhadap lebih dari satu konstrak
dengan menggunakan lebih dari satu metode, kemudian diari interkorelasi antara hasil pengukuran itu. Interkorelasi itu adalah antara hal-hal berikut:
1. Konstrak yang sama diukur dengan alat yang sama
monotrait-monomethode
. 2.
Konstrak yang sama diukur dengan alat yang berbeda
monotrait- heteromethode
. 3.
Konstrak yang berbeda diukur dengan alat yang sama
heterotrait- monomethode
. 4.
Konstrak yang berbeda diukur dengan alat yang berbeda
heterotrait- heteromethode
. Teori koefisien korelasi untuk keempat hal yang telah dijelaskan adalah:
1. Konstrak yang sama diukur dengan alat yang sama
monotrait-monomethode
koefisien korelasinya akan tinggi karena menjelaskan tentang unsur konvergen
2. Konstrak yang berbeda diukur dengan alat yang berbeda
heterotrait- heteromethode
koefisien korelasinya akan tinggi karena menjelaskan tentang unsur diskriminan Suryabrata,2005.
Universitas Sumatera Utara
Penelitian ini akan menggunakan validitas konstruk tes dengan metode
multitrait-multimethode
meliputi validitas diskriminan dan validitas konvergen. c. Interpretasi Koefisien Validitas
Interpretasi koefisien validitas bersifat relatif, tidak ada batasan pasti mengenai koefisien terendah yang harus dipenuhi agar validitas dinyatakan
memuaskan. Estimasi validitas pada umumnya tidak dapat dituntut koefisien yang tinggi sekali.
Koefisien validitas yang dianggap memuaskan akan dikembalikan kepada para penguji validitas dan pemakai tes itu sendiri, terutama pemakai alat tes yang
akan memanfaatkan keputusan yang didasari hasil pengukuran yang bersangkutan Azwar, 2005. Koefisien validitas dapat dianggap memuaskan apabila melebihi 0,30.
Angka ini ditetapkan sebagai konvensi yang didasarkan pada asumsi distribusi skor dari kelompok subjek yang berjumlah besar.
6. Analisis Karakteristik Psikometri
Al
at tes merupakan kumpulan aitem-aitem yang disusun sedemikian rupa sehingga dapat digunakan untuk mengukur sesuatu yang menjadi tujuannya, jadi
dapat dikatakan bahwa alat tes yang berkualitas akan disusun oleh aitem yang berkualitas juga. Kualitas suatu aitem dapat dilihat dari analisis aitemnya, Menurut
Murphy Davidshofer, 2003 analisis aitem dapat memberikan tiga informasi penting yaitu, informasi tentang distraktor, informasi tentang tingkat kesukaran aitem
Universitas Sumatera Utara
dan informasi tentang daya beda aitem. Tiga informasi ini berbeda namun saling terkait satu dan yang lainnya. Hal ini dapat dilihat dalam keterkaitan antara distraktor
dengan kesukaran aitem, kesukaran aitem dengan diskriminasi dan distraktor dengan diskriminasi.
Tingkat kesukaran aitem sangat dipengaruhi oleh tingkat keterpercayaan distraktor, jika semua distraktor tidak masuk akal maka subjek akan dengan mudah
untuk memilih jawaban yang benar tanpa harus memiliki pengetahuan tentang hal yang ditanyakan, tentu hal ini mempengaruhi tingkat kesukaran aitem, sehingga
tingkat kesukaran aitem menjadi rendah. Tingkat kesukaran aitem secara langsung mempengaruhi diskriminasi aitem.
Aitem yang sangat susah
p
= 0 dan aitem yang sangat mudah
p
= 1 tidak dapat membedakan antara subjek yang memiliki pengetahuan dan subjek yang tidak
memiliki pengetahuan sehingga indeks daya beda bernilai rendah. Aitem yang memiliki distraktor yang buruk tentu memiliki indeks daya beda
aitem yang buruk juga, karena sebagaimana yang telah dijelaskan tadi, distraktor yang buruk akan membuat subjek dengan mudah menjawab pertanyaan atau
sebaliknya membuat subjek susah untuk menjawab pertanyaan sehingga juga berpengaruh terhadap diskriminasi aitem karena tidak dapat membedakan subjek
yang memiliki pengetahuan dengan subjek yang tidak memiliki pengetahun. Perubahan banyaknya aitem akan menyebabkan perubahan reliabilitas. Bila
aitem dalam tes bertambah banyak, maka sampai batas tertentu reliabilitasnya juga akan meningkat Azwar, 2005, namun perlu diingat bahwa hanya penambah aitem
Universitas Sumatera Utara
yang berkualitaslah yang dapat meningkatkan reliabilitas. Tes yang meningkat reliabilitasnya akan meningkat pula validitasnya, karena semakin tinggi proporsi
varians skor tampak yang merupakan varians skor murni maka semakin tinggi reliabilitasnya maka semakin besar pula varians yang sama-sama dimiliki oleh tes dan
kriterinya sehingga validitasnya akan semakin tinggi juga. Alat tes yang baik haruslah reliabel dan valid.
C. Intelligenz Strukture Test