Makalah Pengujian instrumen Penilaian Ke
BAB I
PENDAHULUAN
1.1 Latar Belakang
Keberhasilan pendidikan sangat ditentukan oleh proses pembelajaran. Untuk
mengukur keberhasilan proses pembelajaran diperlukan evaluasi dan proses analisis
dari evaluasi.
Manfaat dari analisis evaluasi untuk mengetahui kekuatan dan
kelemahan pembelajaran dalam rangka meningkatkan proses pembelajaran. Karena
itu
begitu pentingnya guru mengadakan analisis butir soal dengan pengujian
instrumen penilaian yaitu validitas, reliabilitas, daya beda dan pola contoh soal.
Ada tiga sasaran pokok ketika guru melakukan analisis terhadap hasil belajar,
yaitu terhadap guru, siswa dan prosedur pembelajaran. Fungsi analisis untuk guru
terutama untuk mendiagnosis keberhasilan pembelajaran dan sebagai bahan untuk
merevisi dan mengembangkan pembelajaran dan tes.
Bagi siswa, analisis diharapkan berfungsi
mengetahui keberhasilan belajar,
mendiagnosa mengoreksi kesalahan belajar, serta Memotivasi siswa belajar lebih
baik. Pada makalah ini akan dibahas mengenai analisis soal berupa validitas,
reliabilitas, daya beda dan pola contoh soal yang berguna sebagai pedoman bagi
pendidikan dalam melakukan analisis soal terutama untuk soal objektif.
1.2 Rumusan Masalah
1.1.1. Apa yang dimaksud dengan Pengujian Instrumen Penilaian?
1.1.2. Jelaskan jenis-jenis instrumen penilaian!
1.3 Tujuan
1.3.1
Menjelaskan pengertian dari Pengujian Instrumen Penilaian.
1.3.2
Menjelaskan jenis-jenis instrumen penilaian.
1
BAB II
PEMBAHASAN
2.1 Pengertian Pengujian Instrumen Penilaian
Pengujian merupakan bagian dari pengukuran yang dilanjutkan dengan
penilaian. Instrumen penilaian bisa berupa metode atau prosedur formal atau
nonformal, untuk menghasilkan informasi tentang peserta didik.
2.2 Jenis-Jenis Pengujian Instrumen Penilaian
2.2.1
Validitas
Merupakan derajat sejauh mana test mengukur apa yang ingin diukur.
Validitas adalah salah satu syarat tes hasil belajar (THB) yang baik. Validitas
berhubungan dengan kemampuan tes hasil belajar untuk mengukur keadaan
yang akan diukurnya. Suatu alat ukur disebut memiliki validitas apabila alat
ukur tersebut isinya layak mengukur objek yang seharusnya diukur dan sesuai
dengan kreteria tertentu, artinya adanya kesesuaian antara alat ukur dengan
fungsi pengukuran dan sasaran pengukuran.
Terdapat 2 macam metode pengujian validitas, antara lain :
Teknik Pengujian Validitas Tes Hasil Belajar
Penganalisisan terhadap tes hasil belajar sebagai suatu totalitas dapat
dilakukan dengan dua cara, yaitu melalui penganalisisan dengan cara berpikir
secara rasional atau menggunakan logika dan penganalisisan dengan cara
menggunakan analisis empiris.
Pengujian Validitas Tes secara rasional
Merupakan validitas yang diperoleh dengan berpikir secara logis.
Dengan demikian maka suatu tes hasil belajar telah memiliki validitas rasional,
apabila setelah dilakukan penganilisisan secara rasional ternyata bahwa tes hasil
2
belajar itu memang dengan tepat telah dapat mengukur apa yang seharusnya
dapat diukur.
Validitas rasional dapat dilakukan dari 2 segi, yaitu :
a. Validitas Isi
Validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh
setelah dilakukan penganalisisan, penelusuran atau pengujian terhadap isi
yang terkandung dalam tes hasil belajar. Dimana hal ini dilihat dari segi isi
tes sebagai alat pengukur hasil belajar peserta didik. Yaitu, sejauh mana tes
hasil belajar peserta didik isinya telah mewakili keseluruhan materi pelajaran
yang diujikan.
Contohnya, dalam suatu kelas peserta didik telah menerima materi
tentang “ Gelombang “, maka soal-soal tes yang diujikan oleh pendidik harus
mencakup keseluruhan materi tentang “ Gelombang “. Selain itu, bentuk soal
yang diberikan telah melalui pengujian atau penganalisisan terlebih dahulu.
b. Validitas Konstruk
Yaitu validitas yang dilihat dari segi susunan, kerangka atau rekaannya.
Dimana validitas ini bukan dipandang dari susunan kalimat soalnya, atau
urutan nomor butir soal yang runtut, melainkan bahwa tes hasil belajar
dikatakan telah memiliki validitas apabila butir-butir soal yang membangun
tes tersebut dapat dengan tepat mengukur aspek kognitif, afektif dan
psikomotorik peserta didik. Dengan demikian, penganalisisan validitas
konstruk dilakukan secara rasional dengan berpikir logis atau logika.
Pengujian Validitas Tes Secara Empiris
Validitas Empiris adalah ketepatan mengukur yang didasarkan pada hasil
analisis yang bersifat empiris. Dengan kata lain validitas empiris adalah validitas
yang bersumber pada atau diperoleh dari atas dasar pengamatan di lapangan.
Untuk menentukan tes hasil belajar sudah memiliki validitas empiris atau belum
dapat dilakukan penelusuran dari dua segi, yaitu:
3
a. Validitas Ramalan
Validitas Ramalan suatu tes adalah suatu kondisi yang menunjukkan
seberapa jauh sebuah tes sudah dapat dengan tepat menunjukkan
kemampuannya untuk meramalkan apa yang terjadi pada masa depan.
Contohnya, tes seleksi penerimaan calon mahasiswa baru pada sebuah
perguruan tinggi. Tes ini diharapkan mampu meramalkan keberhasilan studi
para calon mahasiswa dalam mengikuti program pendidikan di perguruan
tinggi tersebut pada masa-masa yang akan datang.
b. Validitas Bandingan
Tes sebagai alat pengukur telah memiliki validitas bandingan apabila tes
tersebut dalam kurun waktu yang sama dengan secara tepat telah mampu
menunjukan adanya hubungan yang searah, antara tes pertama dengan tes
berikutnya. Dalam rangka menguji validitas bandingan, data yang
mencerminkan pengalaman yang di peroleh pada masa lalu di bandingkan
dengan data hasil tes yang di peroleh sekarang. Jika tes yang ada sekarang
memiliki hubungan searah dengan hasil tes berdasarkan pengalaman yang
lalu, maka tes memiliki karakteristik validitas bandingan.
Contohnya, seorang guru ingin mengetahui apakah tes sumatif yang
disusun sudah valid atau belum. Untuk itu perlu sebuah kreteria masa lalu
yang datanya dimiliki sekarang. Misalnya nilai ulangan harian atau nilai
semester yang lalu.
Validitas Item Tes Hasil Belajar
Validitas item tes hasil belajar adalah ketepatan mengukur yang dimiliki oleh
sebutir item (yang merupakan bagian tak terpisahkan dari tes sebagai suatu
totalitas), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut.
Tes-tes hasil belajar yang dibuat atau disusun oleh para pengajar, baik guru,
dosen dan staf pengajar lainnnya, sebenarnya adalah kumpulan dari sekian
banyak butir-butir item. Dimana dengan item tersebut para penyusun tes ingin
mengukur hasil belajar yang telah dicapai oleh masing-masing individu peserta
didik setelah mengikuti proses pembelajaran dalam jangka waktu tertentu.
4
Pengujian Validitas Item Tes Hasil Belajar
Sebutir item dapat dikatakan validitas yang tinggi atau dapat dikatakan
valid, jika skor-skor pada butir item yang bersangkutan memiliki kesesuaian
atau kesejajaran arah dengan skor totalnya. Skor total disini berkedudukan
sebagai variable terikat, sedangkan skor item berkedudukan sebagai variable
bebasnya. Contohnya 20 orang testee dihadapkan pada tes objektif bentuk
multiple choice item yang menghidangkan 10 butir item, dimana setiap item
yang dijawab betul diberi skor 1, sedangkan butir item yang dijawab salah
diberi skor 0. Setelah tes berakhir, dilakukan koreksi dan dihitung skornya,
diperoleh data hasil tes sebagaimana tertera pada table berikut ini:
e
Skor
Skor untuk butir item nomor
Teste
Total (Xt)
1
2
3
4
5
6
7
8
9
10
A
B
C
0
1
0
1
0
1
0
1
0
0
0
1
0
1
1
1
0
0
0
1
0
0
1
1
0
1
1
1
1
1
3
7
6
D
1
1
1
1
1
1
1
1
1
1
10
E
1
0
1
1
0
1
0
1
1
1
7
F
0
1
0
0
0
1
0
1
0
0
3
G
1
0
0
1
1
1
1
1
1
1
8
H
1
0
1
1
1
1
1
1
1
1
9
I
0
1
0
1
0
1
0
1
0
1
5
J
1
1
1
1
1
1
1
1
1
1
10
K
0
1
1
1
1
1
1
0
0
0
6
L
0
1
1
0
1
0
1
0
1
0
5
M
0
1
0
0
1
0
1
1
0
0
4
N
1
0
1
1
0
1
0
1
1
1
7
O
1
0
0
1
1
1
1
1
1
1
8
P
0
1
0
1
0
1
0
1
0
1
5
Q
1
0
1
1
1
1
1
1
1
1
9
5
2.2.2
R
0
1
0
1
1
1
0
1
0
1
6
S
1
0
0
1
1
1
1
1
1
1
8
T
20=N
0
10
1
12
1
10
0
14
0
13
0
15
1
12
0
16
0
12
1
16
4
∑Xt=130
Reliabilitas
Reliabilitas tes marupakan suatu alat ukur yang digunakan untuk
mengetahui konsistensi pengukuran tes yang hasilnya menunjukan keakuratan
dan kebenaran. Seorang dikatakan dapat di percaya apabila orang tersebut
berbicara benar, tidak berubah-ubah pembicaraannya dari waktu ke waktu.
Dalam sebuah tes pentingnya diamati kebenaran dan kepastian tes tersebut
dilihat dari hasil tes yang didapat.
Terdapat 2 macam metode reliabilitas tes, antara lain :
Reliabilitas Eksternal
Merupakan kestabilan hasil pengukuran apabila tes hasil belajar diujikan
beberapa kali. Reliabitas sebagai stabilitas eksternal ini memandang bahwa tes
hasil belajar dikatakan reliabel apabila diujikan beberapa kali akan memberikan
hasil pengukuran yang relatif konsisten.
Reliabilitas eksternal dapat digolongkan dalam 2 metode, yaitu :
a. Metode Tes Ulang
Merupakan metode pengujian reliabilitas yang dilakukan dengan
mengujikan sebuah perangkat tes hasil belajar kepada kelompok peserta uji
coba yang sama sebanyak dua kali.
Contohnya, dapat disajikan skor hasil testing pada uji coba I dan II suatu
tes hasil belajar yang direspons oleh lima orang siswa memberikn hasil
sebagai berikut :
Responden
X
Y
1
2
3
50
90
60
65
87
50
6
4
5
Keterangan :
90
85
95
74
X = skor responden pada testing uji coba I
Y = skor responden pada testing uji coba II
N = jumlah responden
Rumus Korelasi Product Moment :
r xy =
N ∑ XY −( ∑ X )( ∑ Y )
2
2
√ { N ∑ X −(∑ X) }{N ∑ Y −¿ ¿ ¿
2
Maka hasil korelasi yang merupakan koefisien reliabilitas sebesar 0,82.
b. Metode Pararel
Merupakan pengujian reliabilitas yang dilakukan dengan cara membuat
dua perangkat tes hasil belajar yang pararel dan uji sekaligus. Dua perangkat
tes hasil belajar paralel adalah dua perangkat yang dikembangkan dari
spesifikasi yang sama seperti jumlah butir, pelaksanaan, bentuk, waktu uji
coba, peserta uji coba, dan kisi-kisi. Spesifikasi ini merupakan detail
rancangan yang mengarahkan pada penulisan buti-butir tes hasil belajar yang
akan digunakan untuk pengumpulan data.
Contoh perhitungan koefisien reliabilitas menggunakan metode paralel
pada lima orang siswa memberikan hasil sebagai berikut :
Responden
X
Y
1
60
55
2
85
90
3
70
63
4
85
70
5
75
80
Keterangan :
7
X = skor pada peringkat I
Y = skor pada peringkat II
Perhitungan dilakukan menggunakan rumus Korelasi Product moment,
sehingga memberikan hasil korelasi koefisien reliabilitas sebesar 0,79.
Reliabilitas Internal
Merupakan konsistensi internal hasil pengukuran butir-butir tes hasil belajar.
Tes hasil belajar dikatakan reliabel apabila, diantara butir tes hasil belajar
dihasilkan pengukuran yang konsisten.
Reliabilitas sebagai koefisien konsistensi internal dapat dikelompokkan
menjadi dua, yaitu :
a. Jumlah Butir Genap
Metode pengujian reliabilitas dilakukan atas tes hasil belajar yang
mempunyai jumlah butir genap sehingga butir dapat dibelah menjadi 2
bagian yang sama besar.
1) Metode Belah Dua
Merupakan metode pengujian reliabilitas yang dilakukan dengan cara
membagi butir perangkat tes hasil belajar menjadi dua belahan, selanjutnya
mengkorelasikan skor total kedua belahan.
Menurut cara membelahnya pembelahan dapat dilakukan dengan
membelah butir dalam butir ganjil dan genap atau awal dan akhir.
Contohnya, pada instrumen yang terdiri dari sepuluh butir, pembelahan
ganjil-genap dilakukan dengan mengelompokkan butir 1,3,5,7,9 dalam
belahan pertama dan butir 2,4,6,8,10 dalam belahan kedua. Atau dengan cara
lain, pembelahan atas dasar awal-akhir dengan mengelompokkan butir
1,2,3,4,5 dalam belahan pertama dan butir 6,7,8,9,10 dalam belahan kedua.
N
o
Butir Ganjil
1
3
5
7
∑
9
8
Butir Genap
2
4
6
8
10
∑
∑
∑
1
2
3
4
5
1
0
1
0
1
1
1
1
0
1
1
0
1
0
0
1
0
1
0
1
1
0
1
0
1
5
1
5
0
4
1
0
1
1
1
0
0
1
0
1
0
1
0
0
1
1
0
1
1
1
1
1
1
0
0
3
2
4
2
4
8
3
9
2
8
Jumlah skor kedua belahan selanjutnya dikorelasikan. Data jumlah skor
kedua belahan adalah sebagai berikut :
Responden
X
Y
1
5
3
2
1
2
3
5
4
4
0
2
4
4
5
Keterangan :
X = Jumlah skor butir belahan ganjil
Y = Jumlah skor butir belahan genap
Hasil korelasi skor belahan ganjil dan genap (rxy) menggunakan rumus
korelasi product moment yang memberikan hasil koefisien korelasi sebesar
0,85.
2) Metode Flanagan
Metode ini seperti metode belah dua, juga membagi data manjadi dua
belahan. Pembelahan dapat dilakukan atas dasar ganjil – genap atau awal –
akhir. Selanjutnya, perhitungan koefisien reliabilitas dilakukan dengan
rumus :
S 12 + S22
r 1 1=2 1−
St 2
(
)
Keterangan :
r11 = Koefisien reliabilitas
S12 = Varians skor butir belahan ganjil
S22 = Varians skor butir belahan genap
St2 = Varians skor total
9
Contoh perhitungan koefisien reliabilitas dilakukan dengan langkah
sebagai berikut :
-. Menyusun tabel persiapan
N
Butir Ganjil
Butir Genap
o
1
3
5
7
9
1
2
3
4
5
1
0
1
0
1
1
1
1
0
1
1
0
1
0
0
1
0
1
0
1
1
0
1
0
1
2
i
Xi
X
5
1
5
0
4
1
25
1
25
0
16
5
2
4
6
8
1
0
1
1
1
0
0
1
0
1
0
1
0
0
1
1
0
1
1
1
67
1
0
1
1
1
0
0
Xi
Xi2 Xt
Xt2
3
2
4
2
4
1
9
4
16
4
16
8
3
9
2
8
3
64
9
81
4
64
22
0
2
5
49
-. Menghitung Varians
Perhitungan varians dilakukan dengan menggunakan rumus sebagai
berikut :
(∑ X i2)
Si2 = ∑ X i − N
N
2
Varians hasil perhitungan adalah sebagai berikut :
Skor Kelompok butir belahan ganjil
(15)2
64−
S =
5
5
2
i
= 3,8
Skor kelompok butir belahan genap
(15)2
49−
S =
5
5
2
i
= 0,8
Skor Total
(30)2
Si2 = 222− 5
5
= 8,4
Menghitung Koefisien reliabilitas
10
(
r 1 1=2 1−
3,8+0,8
8,4 =0,90
)
3) Metode Rulon
Metode ini dilakukan dengan menghitung selisih skor pada kedua
belahan. Rumus yang digunakan yaitu :
S d2
r11 = 1- 2
St
Keterangan :
Sd2 = varians beda
St2 = varians total
b. Jumlah Butir Ganjil
Merupakan pengujian reliabilitas sebagai koefisien konsistensi internal
dimana butir instrumen berjumlah ganjil dapat
menggunakan metode -
metode, yaitu :
1) Metode Kuder – Richardson
Perhitungan koefisien reliabilitas menggunakan metode Kuder –
Richardson di lakukan dengan rumus berikut :
n
r 11 = n−1
(
)(
St2 −∑ pq
St 2
)
Keterangan :
n = jumlah butir
St2 = varians total
p = proporsi skor yang diperoleh
q = proporsi skor maksimum dikurangi skor yang diperoleh
2) Metode Hoyt
Perhitungan koefisien reliabilitas menggunakan metode Hoyt
dilakukan dengan rumus berikut :
r 11 =1−
V ( s)
V (r )
11
Keterangan :
r11 = koefisien reliabilitas
V(r) = Varians responden
V(s) = Varians sisa
3) Alpha Cronbach
Perhitungan koefisien reliabilitas dapat dilakukan menggunakan
metode Alpha cronbach dengan rumus berikut :
2
n
∑ Si
r 11 =1− n−1 1−
∑ S t2
(
)(
)
Keterangan :
n = jumlah butir
Si2 = varians butir
St2 = varians total
2.2.3
Daya Beda
Daya beda adalah kemampuan item untuk membedakan antara individu
yang memiliki performansi tinggi dan rendah. Daya beda adalah analisis yang
mengungkapkan seberapa besar butir tes dapat membedakan antara siswa
kelompok tinggi dengan siswa kelompok rendah. Salah satu ciri butir yang baik
adalah yang mampu membedakan antara siswa kelompok atas (yang mampu)
dan siswa kelompok bawah (kurang mampu). Siswa kelompok atas adalah
kelompok siswa yang tergolong pandai atau mencapai skor total hasil belajar
yang tinggi dan siswa kelompok bawah adalah kelompok siswa yang kurang
pandai atau memperoleh skor total hasil belajar yang rendah.
Daya Beda (DB) dapat ditentukan besarannya dengan rumus sebagai
berikut :
DB = PT – PR atau
12
DB =
∑ T B −∑ RB
∑T ∑ R
Keterangan :
PT = proporsi siswa yang menjawab benar pada kelompok siswa yang
mempunyai kemampuan tinggi.
PR = proporsi siswayang menjawab benar pada kelompok siswa yang
mempunyai kemampuan rendah.
TB = jumlah peserta yang menjawab benar pada kelompok siswa yang
mempunyai kemampuan tinggi.
T = jumlah kelompok siswa yang mempunyai kemampuan tinggi.
RB = jumlah peserta yang menjawab benar pada kelompok siswa yang
mempunyai kemampuan rendah.
R = jumlah kelompok siswa yang mempunyai kemampuan rendah.
Contohnya, 10 orang mengikuti uji coba tes hasil belajar berbentuk
objektif dengan hasil dengan hasil sebagai berikut :
Sisw
a
1
A
1
B
0
C
1
D
1
E
0
F
1
G
0
H
0
I
1
J
1
Perhitungan
Butir Soal
2
1
1
1
0
0
0
0
1
0
1
Daya
3
1
0
1
1
0
1
1
0
0
1
beda
4
1
0
0
1
1
1
1
0
0
1
dapat
5
6
7
1
1
1
1
0
0
1
1
1
1
1
1
1
1
0
1
1
1
0
1
1
0
1
0
0
0
0
1
1
1
dilakukan dengan
berikut:
13
Jumla
h
8
9
10
1
1
1
10
1
0
0
3
1
1
0
8
1
1
1
9
0
0
1
4
1
1
1
9
0
1
0
5
0
0
1
3
0
1
0
2
1
1
1
10
langkah-langkah sebagai
1. Menetukan siswa kelompok atas dan bawah. Kelompok atas adalah setengah
kelompok siswa ( 5 orang ) yang memperoleh jumlah skor tertinggi.
Kelompok bawah adalah setengah kelompok siswa ( 5 orang ) yang
memperoleh skor terendah. Penentuan kelompok atas dan kelompok bawah
dapat disajikan dalam tabel berikut :
Kelompok atas
Siswa
Skor
A
10
C
8
D
9
F
9
J
10
2.
Kelompok bawah
Siswa
Skor
B
3
E
4
G
5
H
3
I
2
Menghitung perolehan skor butir pada kelompok atas dan kelompok
Siswa
A
C
D
F
J
Jumla
h
Siswa
B
E
G
H
I
Jumla
h
1
1
1
1
1
1
2
0
1
0
0
1
3
1
1
1
1
1
5
2
5
1
0
0
0
0
1
2
1
1
1
1
0
3
0
0
1
0
0
1
4
1
Kelompok atas
Butir Soal
4
5
6
1
1
1
0
1
1
1
1
1
1
1
1
1
1
1
4
5
5
Kelompok bawah
Butir Soal
4
5
6
0
1
0
1
1
1
1
0
1
0
0
0
0
0
0
2
14
2
2
7
1
1
1
1
1
8
1
1
1
1
1
9
1
1
1
1
1
10
1
0
1
1
1
5
5
5
4
7
0
0
1
0
0
8
1
0
0
0
0
9
0
0
1
1
0
10
0
1
0
1
0
1
1
2
2
3. Menghitung Daya Beda
Daya beda dihitung sebagaimana rumusnya sebagai berikut :
a. Butir 1
5 1 4
Daya Beda (1) = 5 − 5 = 5 =0,80
b. Butir 2
2 4 −2
Daya beda (2) = 5 − 5 = 5 =−0,40
2.2.4
Tingkat Kesukaran Soal
Tingkat kesukaran berhubungan dengan banyaknya testee (siswa) yang
bisa menjawab dengan benar suatu butir soal tes. Suatu butir soal tes dikatakan
baik, bila memenuhi fungsinya secara tepat. Butir soal yang terlalu sukar tidak
berhasil mengungkapkan apa yang diketahui siswa. Semua tidak bisa menjawab
pertanyaan dengan benar. Sebaliknya, butir soal yang terlalu mudah ,tidak
berhasil mengungkap apa yang belum diketahui siswa. Tidak bisa mengukur
secara tepat kemampuan yang dimiliki siswa. Semua bisa menjawab dengan
betul.
Untuk itu, dalam merumuskan butir soal, perlu dilihat tingkat
kesukarannya secara empiric. Rumusannya adalah sebagai berikut :
Keterangan :
P = Indeks Kesukaran
B = Banyaknya testee menjawab butir soal dengan benar.
Js = Jumlah seluruh testee (siswa)
Soal yang baik adalah soal yang memiliki tingkat kesukaran yang
memadai untuk mengungkap penguasaan siswa secara tepat. Soal dengan P
sebesar 0,0 sampai dengan 0,30 adalah soal sukar. Soal dengan P sebesar 0,3
sampai dengan 0,70 adalah sola sedang. Soal dengan P sebesar 0,70 sampai
dengan 0,70 sampai dengan 1,00 termasuk soal mudah.
Untuk merumuskan butir soal yang baik, secara umum, bisa digunakan
acuan soal yang cukup memadai; bila memiliki tingkat kesukaran 0,30 sampai
15
dengan 0,70. Namun hal ini juga perlu mempertimbangkan proporsi butir soal
yang sukar, sedang dan mudah, sehingga bisa benar-benar tepat dalam mengukur
kemampuan siswa.
BAB III
PENUTUP
3.1 Kesimpulan
Validitas adalah salah satu syarat tes hasil belajar (THB) yang baik.
Validitas berhubungan dengan kemampuan tes hasil belajar untuk mengukur
keadaan yang akan diukurnya.
Reliabilitas tes marupakan suatu alat ukur yang digunakan untuk
mengetahui konsistensi pengukuran tes yang hasilnya menunjukan
keakuratan dan kebenaran.
Daya beda adalah kemampuan item untuk membedakan antara individu
yang memiliki performansi tinggi dan rendah. Daya beda adalah analisis
yang mengungkapkan seberapa besar butir tes dapat membedakan antara
siswa kelompok tinggi dengan siswa kelompok rendah.
16
Tingkat kesukaran berhubungan dengan banyaknya testee (siswa) yang
bisa menjawab dengan benar suatu butir soal tes. Suatu butir soal tes
dikatakan baik, bila memenuhi fungsinya secara tepat.
DAFTAR PUSTAKA
Purwanto. 2008. Evaluasi hasil Belajar. Yogyakarta: Pustaka Belajar
Sudijono, A. 2012. Pengantar Evaluasi Pendidikan. Jakarta : Raja Grafindo Persada
Tumardi. 2008. Evaluasi Pembelajaran. Malang : Laboratorium Teknologi Pendidikan
Fakultas Ilmu Pendidikan Universitas Negeri Malang
17
PENDAHULUAN
1.1 Latar Belakang
Keberhasilan pendidikan sangat ditentukan oleh proses pembelajaran. Untuk
mengukur keberhasilan proses pembelajaran diperlukan evaluasi dan proses analisis
dari evaluasi.
Manfaat dari analisis evaluasi untuk mengetahui kekuatan dan
kelemahan pembelajaran dalam rangka meningkatkan proses pembelajaran. Karena
itu
begitu pentingnya guru mengadakan analisis butir soal dengan pengujian
instrumen penilaian yaitu validitas, reliabilitas, daya beda dan pola contoh soal.
Ada tiga sasaran pokok ketika guru melakukan analisis terhadap hasil belajar,
yaitu terhadap guru, siswa dan prosedur pembelajaran. Fungsi analisis untuk guru
terutama untuk mendiagnosis keberhasilan pembelajaran dan sebagai bahan untuk
merevisi dan mengembangkan pembelajaran dan tes.
Bagi siswa, analisis diharapkan berfungsi
mengetahui keberhasilan belajar,
mendiagnosa mengoreksi kesalahan belajar, serta Memotivasi siswa belajar lebih
baik. Pada makalah ini akan dibahas mengenai analisis soal berupa validitas,
reliabilitas, daya beda dan pola contoh soal yang berguna sebagai pedoman bagi
pendidikan dalam melakukan analisis soal terutama untuk soal objektif.
1.2 Rumusan Masalah
1.1.1. Apa yang dimaksud dengan Pengujian Instrumen Penilaian?
1.1.2. Jelaskan jenis-jenis instrumen penilaian!
1.3 Tujuan
1.3.1
Menjelaskan pengertian dari Pengujian Instrumen Penilaian.
1.3.2
Menjelaskan jenis-jenis instrumen penilaian.
1
BAB II
PEMBAHASAN
2.1 Pengertian Pengujian Instrumen Penilaian
Pengujian merupakan bagian dari pengukuran yang dilanjutkan dengan
penilaian. Instrumen penilaian bisa berupa metode atau prosedur formal atau
nonformal, untuk menghasilkan informasi tentang peserta didik.
2.2 Jenis-Jenis Pengujian Instrumen Penilaian
2.2.1
Validitas
Merupakan derajat sejauh mana test mengukur apa yang ingin diukur.
Validitas adalah salah satu syarat tes hasil belajar (THB) yang baik. Validitas
berhubungan dengan kemampuan tes hasil belajar untuk mengukur keadaan
yang akan diukurnya. Suatu alat ukur disebut memiliki validitas apabila alat
ukur tersebut isinya layak mengukur objek yang seharusnya diukur dan sesuai
dengan kreteria tertentu, artinya adanya kesesuaian antara alat ukur dengan
fungsi pengukuran dan sasaran pengukuran.
Terdapat 2 macam metode pengujian validitas, antara lain :
Teknik Pengujian Validitas Tes Hasil Belajar
Penganalisisan terhadap tes hasil belajar sebagai suatu totalitas dapat
dilakukan dengan dua cara, yaitu melalui penganalisisan dengan cara berpikir
secara rasional atau menggunakan logika dan penganalisisan dengan cara
menggunakan analisis empiris.
Pengujian Validitas Tes secara rasional
Merupakan validitas yang diperoleh dengan berpikir secara logis.
Dengan demikian maka suatu tes hasil belajar telah memiliki validitas rasional,
apabila setelah dilakukan penganilisisan secara rasional ternyata bahwa tes hasil
2
belajar itu memang dengan tepat telah dapat mengukur apa yang seharusnya
dapat diukur.
Validitas rasional dapat dilakukan dari 2 segi, yaitu :
a. Validitas Isi
Validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh
setelah dilakukan penganalisisan, penelusuran atau pengujian terhadap isi
yang terkandung dalam tes hasil belajar. Dimana hal ini dilihat dari segi isi
tes sebagai alat pengukur hasil belajar peserta didik. Yaitu, sejauh mana tes
hasil belajar peserta didik isinya telah mewakili keseluruhan materi pelajaran
yang diujikan.
Contohnya, dalam suatu kelas peserta didik telah menerima materi
tentang “ Gelombang “, maka soal-soal tes yang diujikan oleh pendidik harus
mencakup keseluruhan materi tentang “ Gelombang “. Selain itu, bentuk soal
yang diberikan telah melalui pengujian atau penganalisisan terlebih dahulu.
b. Validitas Konstruk
Yaitu validitas yang dilihat dari segi susunan, kerangka atau rekaannya.
Dimana validitas ini bukan dipandang dari susunan kalimat soalnya, atau
urutan nomor butir soal yang runtut, melainkan bahwa tes hasil belajar
dikatakan telah memiliki validitas apabila butir-butir soal yang membangun
tes tersebut dapat dengan tepat mengukur aspek kognitif, afektif dan
psikomotorik peserta didik. Dengan demikian, penganalisisan validitas
konstruk dilakukan secara rasional dengan berpikir logis atau logika.
Pengujian Validitas Tes Secara Empiris
Validitas Empiris adalah ketepatan mengukur yang didasarkan pada hasil
analisis yang bersifat empiris. Dengan kata lain validitas empiris adalah validitas
yang bersumber pada atau diperoleh dari atas dasar pengamatan di lapangan.
Untuk menentukan tes hasil belajar sudah memiliki validitas empiris atau belum
dapat dilakukan penelusuran dari dua segi, yaitu:
3
a. Validitas Ramalan
Validitas Ramalan suatu tes adalah suatu kondisi yang menunjukkan
seberapa jauh sebuah tes sudah dapat dengan tepat menunjukkan
kemampuannya untuk meramalkan apa yang terjadi pada masa depan.
Contohnya, tes seleksi penerimaan calon mahasiswa baru pada sebuah
perguruan tinggi. Tes ini diharapkan mampu meramalkan keberhasilan studi
para calon mahasiswa dalam mengikuti program pendidikan di perguruan
tinggi tersebut pada masa-masa yang akan datang.
b. Validitas Bandingan
Tes sebagai alat pengukur telah memiliki validitas bandingan apabila tes
tersebut dalam kurun waktu yang sama dengan secara tepat telah mampu
menunjukan adanya hubungan yang searah, antara tes pertama dengan tes
berikutnya. Dalam rangka menguji validitas bandingan, data yang
mencerminkan pengalaman yang di peroleh pada masa lalu di bandingkan
dengan data hasil tes yang di peroleh sekarang. Jika tes yang ada sekarang
memiliki hubungan searah dengan hasil tes berdasarkan pengalaman yang
lalu, maka tes memiliki karakteristik validitas bandingan.
Contohnya, seorang guru ingin mengetahui apakah tes sumatif yang
disusun sudah valid atau belum. Untuk itu perlu sebuah kreteria masa lalu
yang datanya dimiliki sekarang. Misalnya nilai ulangan harian atau nilai
semester yang lalu.
Validitas Item Tes Hasil Belajar
Validitas item tes hasil belajar adalah ketepatan mengukur yang dimiliki oleh
sebutir item (yang merupakan bagian tak terpisahkan dari tes sebagai suatu
totalitas), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut.
Tes-tes hasil belajar yang dibuat atau disusun oleh para pengajar, baik guru,
dosen dan staf pengajar lainnnya, sebenarnya adalah kumpulan dari sekian
banyak butir-butir item. Dimana dengan item tersebut para penyusun tes ingin
mengukur hasil belajar yang telah dicapai oleh masing-masing individu peserta
didik setelah mengikuti proses pembelajaran dalam jangka waktu tertentu.
4
Pengujian Validitas Item Tes Hasil Belajar
Sebutir item dapat dikatakan validitas yang tinggi atau dapat dikatakan
valid, jika skor-skor pada butir item yang bersangkutan memiliki kesesuaian
atau kesejajaran arah dengan skor totalnya. Skor total disini berkedudukan
sebagai variable terikat, sedangkan skor item berkedudukan sebagai variable
bebasnya. Contohnya 20 orang testee dihadapkan pada tes objektif bentuk
multiple choice item yang menghidangkan 10 butir item, dimana setiap item
yang dijawab betul diberi skor 1, sedangkan butir item yang dijawab salah
diberi skor 0. Setelah tes berakhir, dilakukan koreksi dan dihitung skornya,
diperoleh data hasil tes sebagaimana tertera pada table berikut ini:
e
Skor
Skor untuk butir item nomor
Teste
Total (Xt)
1
2
3
4
5
6
7
8
9
10
A
B
C
0
1
0
1
0
1
0
1
0
0
0
1
0
1
1
1
0
0
0
1
0
0
1
1
0
1
1
1
1
1
3
7
6
D
1
1
1
1
1
1
1
1
1
1
10
E
1
0
1
1
0
1
0
1
1
1
7
F
0
1
0
0
0
1
0
1
0
0
3
G
1
0
0
1
1
1
1
1
1
1
8
H
1
0
1
1
1
1
1
1
1
1
9
I
0
1
0
1
0
1
0
1
0
1
5
J
1
1
1
1
1
1
1
1
1
1
10
K
0
1
1
1
1
1
1
0
0
0
6
L
0
1
1
0
1
0
1
0
1
0
5
M
0
1
0
0
1
0
1
1
0
0
4
N
1
0
1
1
0
1
0
1
1
1
7
O
1
0
0
1
1
1
1
1
1
1
8
P
0
1
0
1
0
1
0
1
0
1
5
Q
1
0
1
1
1
1
1
1
1
1
9
5
2.2.2
R
0
1
0
1
1
1
0
1
0
1
6
S
1
0
0
1
1
1
1
1
1
1
8
T
20=N
0
10
1
12
1
10
0
14
0
13
0
15
1
12
0
16
0
12
1
16
4
∑Xt=130
Reliabilitas
Reliabilitas tes marupakan suatu alat ukur yang digunakan untuk
mengetahui konsistensi pengukuran tes yang hasilnya menunjukan keakuratan
dan kebenaran. Seorang dikatakan dapat di percaya apabila orang tersebut
berbicara benar, tidak berubah-ubah pembicaraannya dari waktu ke waktu.
Dalam sebuah tes pentingnya diamati kebenaran dan kepastian tes tersebut
dilihat dari hasil tes yang didapat.
Terdapat 2 macam metode reliabilitas tes, antara lain :
Reliabilitas Eksternal
Merupakan kestabilan hasil pengukuran apabila tes hasil belajar diujikan
beberapa kali. Reliabitas sebagai stabilitas eksternal ini memandang bahwa tes
hasil belajar dikatakan reliabel apabila diujikan beberapa kali akan memberikan
hasil pengukuran yang relatif konsisten.
Reliabilitas eksternal dapat digolongkan dalam 2 metode, yaitu :
a. Metode Tes Ulang
Merupakan metode pengujian reliabilitas yang dilakukan dengan
mengujikan sebuah perangkat tes hasil belajar kepada kelompok peserta uji
coba yang sama sebanyak dua kali.
Contohnya, dapat disajikan skor hasil testing pada uji coba I dan II suatu
tes hasil belajar yang direspons oleh lima orang siswa memberikn hasil
sebagai berikut :
Responden
X
Y
1
2
3
50
90
60
65
87
50
6
4
5
Keterangan :
90
85
95
74
X = skor responden pada testing uji coba I
Y = skor responden pada testing uji coba II
N = jumlah responden
Rumus Korelasi Product Moment :
r xy =
N ∑ XY −( ∑ X )( ∑ Y )
2
2
√ { N ∑ X −(∑ X) }{N ∑ Y −¿ ¿ ¿
2
Maka hasil korelasi yang merupakan koefisien reliabilitas sebesar 0,82.
b. Metode Pararel
Merupakan pengujian reliabilitas yang dilakukan dengan cara membuat
dua perangkat tes hasil belajar yang pararel dan uji sekaligus. Dua perangkat
tes hasil belajar paralel adalah dua perangkat yang dikembangkan dari
spesifikasi yang sama seperti jumlah butir, pelaksanaan, bentuk, waktu uji
coba, peserta uji coba, dan kisi-kisi. Spesifikasi ini merupakan detail
rancangan yang mengarahkan pada penulisan buti-butir tes hasil belajar yang
akan digunakan untuk pengumpulan data.
Contoh perhitungan koefisien reliabilitas menggunakan metode paralel
pada lima orang siswa memberikan hasil sebagai berikut :
Responden
X
Y
1
60
55
2
85
90
3
70
63
4
85
70
5
75
80
Keterangan :
7
X = skor pada peringkat I
Y = skor pada peringkat II
Perhitungan dilakukan menggunakan rumus Korelasi Product moment,
sehingga memberikan hasil korelasi koefisien reliabilitas sebesar 0,79.
Reliabilitas Internal
Merupakan konsistensi internal hasil pengukuran butir-butir tes hasil belajar.
Tes hasil belajar dikatakan reliabel apabila, diantara butir tes hasil belajar
dihasilkan pengukuran yang konsisten.
Reliabilitas sebagai koefisien konsistensi internal dapat dikelompokkan
menjadi dua, yaitu :
a. Jumlah Butir Genap
Metode pengujian reliabilitas dilakukan atas tes hasil belajar yang
mempunyai jumlah butir genap sehingga butir dapat dibelah menjadi 2
bagian yang sama besar.
1) Metode Belah Dua
Merupakan metode pengujian reliabilitas yang dilakukan dengan cara
membagi butir perangkat tes hasil belajar menjadi dua belahan, selanjutnya
mengkorelasikan skor total kedua belahan.
Menurut cara membelahnya pembelahan dapat dilakukan dengan
membelah butir dalam butir ganjil dan genap atau awal dan akhir.
Contohnya, pada instrumen yang terdiri dari sepuluh butir, pembelahan
ganjil-genap dilakukan dengan mengelompokkan butir 1,3,5,7,9 dalam
belahan pertama dan butir 2,4,6,8,10 dalam belahan kedua. Atau dengan cara
lain, pembelahan atas dasar awal-akhir dengan mengelompokkan butir
1,2,3,4,5 dalam belahan pertama dan butir 6,7,8,9,10 dalam belahan kedua.
N
o
Butir Ganjil
1
3
5
7
∑
9
8
Butir Genap
2
4
6
8
10
∑
∑
∑
1
2
3
4
5
1
0
1
0
1
1
1
1
0
1
1
0
1
0
0
1
0
1
0
1
1
0
1
0
1
5
1
5
0
4
1
0
1
1
1
0
0
1
0
1
0
1
0
0
1
1
0
1
1
1
1
1
1
0
0
3
2
4
2
4
8
3
9
2
8
Jumlah skor kedua belahan selanjutnya dikorelasikan. Data jumlah skor
kedua belahan adalah sebagai berikut :
Responden
X
Y
1
5
3
2
1
2
3
5
4
4
0
2
4
4
5
Keterangan :
X = Jumlah skor butir belahan ganjil
Y = Jumlah skor butir belahan genap
Hasil korelasi skor belahan ganjil dan genap (rxy) menggunakan rumus
korelasi product moment yang memberikan hasil koefisien korelasi sebesar
0,85.
2) Metode Flanagan
Metode ini seperti metode belah dua, juga membagi data manjadi dua
belahan. Pembelahan dapat dilakukan atas dasar ganjil – genap atau awal –
akhir. Selanjutnya, perhitungan koefisien reliabilitas dilakukan dengan
rumus :
S 12 + S22
r 1 1=2 1−
St 2
(
)
Keterangan :
r11 = Koefisien reliabilitas
S12 = Varians skor butir belahan ganjil
S22 = Varians skor butir belahan genap
St2 = Varians skor total
9
Contoh perhitungan koefisien reliabilitas dilakukan dengan langkah
sebagai berikut :
-. Menyusun tabel persiapan
N
Butir Ganjil
Butir Genap
o
1
3
5
7
9
1
2
3
4
5
1
0
1
0
1
1
1
1
0
1
1
0
1
0
0
1
0
1
0
1
1
0
1
0
1
2
i
Xi
X
5
1
5
0
4
1
25
1
25
0
16
5
2
4
6
8
1
0
1
1
1
0
0
1
0
1
0
1
0
0
1
1
0
1
1
1
67
1
0
1
1
1
0
0
Xi
Xi2 Xt
Xt2
3
2
4
2
4
1
9
4
16
4
16
8
3
9
2
8
3
64
9
81
4
64
22
0
2
5
49
-. Menghitung Varians
Perhitungan varians dilakukan dengan menggunakan rumus sebagai
berikut :
(∑ X i2)
Si2 = ∑ X i − N
N
2
Varians hasil perhitungan adalah sebagai berikut :
Skor Kelompok butir belahan ganjil
(15)2
64−
S =
5
5
2
i
= 3,8
Skor kelompok butir belahan genap
(15)2
49−
S =
5
5
2
i
= 0,8
Skor Total
(30)2
Si2 = 222− 5
5
= 8,4
Menghitung Koefisien reliabilitas
10
(
r 1 1=2 1−
3,8+0,8
8,4 =0,90
)
3) Metode Rulon
Metode ini dilakukan dengan menghitung selisih skor pada kedua
belahan. Rumus yang digunakan yaitu :
S d2
r11 = 1- 2
St
Keterangan :
Sd2 = varians beda
St2 = varians total
b. Jumlah Butir Ganjil
Merupakan pengujian reliabilitas sebagai koefisien konsistensi internal
dimana butir instrumen berjumlah ganjil dapat
menggunakan metode -
metode, yaitu :
1) Metode Kuder – Richardson
Perhitungan koefisien reliabilitas menggunakan metode Kuder –
Richardson di lakukan dengan rumus berikut :
n
r 11 = n−1
(
)(
St2 −∑ pq
St 2
)
Keterangan :
n = jumlah butir
St2 = varians total
p = proporsi skor yang diperoleh
q = proporsi skor maksimum dikurangi skor yang diperoleh
2) Metode Hoyt
Perhitungan koefisien reliabilitas menggunakan metode Hoyt
dilakukan dengan rumus berikut :
r 11 =1−
V ( s)
V (r )
11
Keterangan :
r11 = koefisien reliabilitas
V(r) = Varians responden
V(s) = Varians sisa
3) Alpha Cronbach
Perhitungan koefisien reliabilitas dapat dilakukan menggunakan
metode Alpha cronbach dengan rumus berikut :
2
n
∑ Si
r 11 =1− n−1 1−
∑ S t2
(
)(
)
Keterangan :
n = jumlah butir
Si2 = varians butir
St2 = varians total
2.2.3
Daya Beda
Daya beda adalah kemampuan item untuk membedakan antara individu
yang memiliki performansi tinggi dan rendah. Daya beda adalah analisis yang
mengungkapkan seberapa besar butir tes dapat membedakan antara siswa
kelompok tinggi dengan siswa kelompok rendah. Salah satu ciri butir yang baik
adalah yang mampu membedakan antara siswa kelompok atas (yang mampu)
dan siswa kelompok bawah (kurang mampu). Siswa kelompok atas adalah
kelompok siswa yang tergolong pandai atau mencapai skor total hasil belajar
yang tinggi dan siswa kelompok bawah adalah kelompok siswa yang kurang
pandai atau memperoleh skor total hasil belajar yang rendah.
Daya Beda (DB) dapat ditentukan besarannya dengan rumus sebagai
berikut :
DB = PT – PR atau
12
DB =
∑ T B −∑ RB
∑T ∑ R
Keterangan :
PT = proporsi siswa yang menjawab benar pada kelompok siswa yang
mempunyai kemampuan tinggi.
PR = proporsi siswayang menjawab benar pada kelompok siswa yang
mempunyai kemampuan rendah.
TB = jumlah peserta yang menjawab benar pada kelompok siswa yang
mempunyai kemampuan tinggi.
T = jumlah kelompok siswa yang mempunyai kemampuan tinggi.
RB = jumlah peserta yang menjawab benar pada kelompok siswa yang
mempunyai kemampuan rendah.
R = jumlah kelompok siswa yang mempunyai kemampuan rendah.
Contohnya, 10 orang mengikuti uji coba tes hasil belajar berbentuk
objektif dengan hasil dengan hasil sebagai berikut :
Sisw
a
1
A
1
B
0
C
1
D
1
E
0
F
1
G
0
H
0
I
1
J
1
Perhitungan
Butir Soal
2
1
1
1
0
0
0
0
1
0
1
Daya
3
1
0
1
1
0
1
1
0
0
1
beda
4
1
0
0
1
1
1
1
0
0
1
dapat
5
6
7
1
1
1
1
0
0
1
1
1
1
1
1
1
1
0
1
1
1
0
1
1
0
1
0
0
0
0
1
1
1
dilakukan dengan
berikut:
13
Jumla
h
8
9
10
1
1
1
10
1
0
0
3
1
1
0
8
1
1
1
9
0
0
1
4
1
1
1
9
0
1
0
5
0
0
1
3
0
1
0
2
1
1
1
10
langkah-langkah sebagai
1. Menetukan siswa kelompok atas dan bawah. Kelompok atas adalah setengah
kelompok siswa ( 5 orang ) yang memperoleh jumlah skor tertinggi.
Kelompok bawah adalah setengah kelompok siswa ( 5 orang ) yang
memperoleh skor terendah. Penentuan kelompok atas dan kelompok bawah
dapat disajikan dalam tabel berikut :
Kelompok atas
Siswa
Skor
A
10
C
8
D
9
F
9
J
10
2.
Kelompok bawah
Siswa
Skor
B
3
E
4
G
5
H
3
I
2
Menghitung perolehan skor butir pada kelompok atas dan kelompok
Siswa
A
C
D
F
J
Jumla
h
Siswa
B
E
G
H
I
Jumla
h
1
1
1
1
1
1
2
0
1
0
0
1
3
1
1
1
1
1
5
2
5
1
0
0
0
0
1
2
1
1
1
1
0
3
0
0
1
0
0
1
4
1
Kelompok atas
Butir Soal
4
5
6
1
1
1
0
1
1
1
1
1
1
1
1
1
1
1
4
5
5
Kelompok bawah
Butir Soal
4
5
6
0
1
0
1
1
1
1
0
1
0
0
0
0
0
0
2
14
2
2
7
1
1
1
1
1
8
1
1
1
1
1
9
1
1
1
1
1
10
1
0
1
1
1
5
5
5
4
7
0
0
1
0
0
8
1
0
0
0
0
9
0
0
1
1
0
10
0
1
0
1
0
1
1
2
2
3. Menghitung Daya Beda
Daya beda dihitung sebagaimana rumusnya sebagai berikut :
a. Butir 1
5 1 4
Daya Beda (1) = 5 − 5 = 5 =0,80
b. Butir 2
2 4 −2
Daya beda (2) = 5 − 5 = 5 =−0,40
2.2.4
Tingkat Kesukaran Soal
Tingkat kesukaran berhubungan dengan banyaknya testee (siswa) yang
bisa menjawab dengan benar suatu butir soal tes. Suatu butir soal tes dikatakan
baik, bila memenuhi fungsinya secara tepat. Butir soal yang terlalu sukar tidak
berhasil mengungkapkan apa yang diketahui siswa. Semua tidak bisa menjawab
pertanyaan dengan benar. Sebaliknya, butir soal yang terlalu mudah ,tidak
berhasil mengungkap apa yang belum diketahui siswa. Tidak bisa mengukur
secara tepat kemampuan yang dimiliki siswa. Semua bisa menjawab dengan
betul.
Untuk itu, dalam merumuskan butir soal, perlu dilihat tingkat
kesukarannya secara empiric. Rumusannya adalah sebagai berikut :
Keterangan :
P = Indeks Kesukaran
B = Banyaknya testee menjawab butir soal dengan benar.
Js = Jumlah seluruh testee (siswa)
Soal yang baik adalah soal yang memiliki tingkat kesukaran yang
memadai untuk mengungkap penguasaan siswa secara tepat. Soal dengan P
sebesar 0,0 sampai dengan 0,30 adalah soal sukar. Soal dengan P sebesar 0,3
sampai dengan 0,70 adalah sola sedang. Soal dengan P sebesar 0,70 sampai
dengan 0,70 sampai dengan 1,00 termasuk soal mudah.
Untuk merumuskan butir soal yang baik, secara umum, bisa digunakan
acuan soal yang cukup memadai; bila memiliki tingkat kesukaran 0,30 sampai
15
dengan 0,70. Namun hal ini juga perlu mempertimbangkan proporsi butir soal
yang sukar, sedang dan mudah, sehingga bisa benar-benar tepat dalam mengukur
kemampuan siswa.
BAB III
PENUTUP
3.1 Kesimpulan
Validitas adalah salah satu syarat tes hasil belajar (THB) yang baik.
Validitas berhubungan dengan kemampuan tes hasil belajar untuk mengukur
keadaan yang akan diukurnya.
Reliabilitas tes marupakan suatu alat ukur yang digunakan untuk
mengetahui konsistensi pengukuran tes yang hasilnya menunjukan
keakuratan dan kebenaran.
Daya beda adalah kemampuan item untuk membedakan antara individu
yang memiliki performansi tinggi dan rendah. Daya beda adalah analisis
yang mengungkapkan seberapa besar butir tes dapat membedakan antara
siswa kelompok tinggi dengan siswa kelompok rendah.
16
Tingkat kesukaran berhubungan dengan banyaknya testee (siswa) yang
bisa menjawab dengan benar suatu butir soal tes. Suatu butir soal tes
dikatakan baik, bila memenuhi fungsinya secara tepat.
DAFTAR PUSTAKA
Purwanto. 2008. Evaluasi hasil Belajar. Yogyakarta: Pustaka Belajar
Sudijono, A. 2012. Pengantar Evaluasi Pendidikan. Jakarta : Raja Grafindo Persada
Tumardi. 2008. Evaluasi Pembelajaran. Malang : Laboratorium Teknologi Pendidikan
Fakultas Ilmu Pendidikan Universitas Negeri Malang
17