a.  Evaluasi tertulis Evaluasi  di  gunakan  untuk  mengetahui  dan  mengukur  seberapa  besar
hasil belajar  IPA Biologi siswa, mengukur keberhasilan dan efisiensi pembelajaran  yang  di  lakukan  serta  seberapa  jauh  siswa  menyerap
materi  pelajaran  yang  telah  disampaikan.  Evaluasi  ini  dilakukan  pada akhir siklus setelah proses pembelajaran selesai.
b.  Observasi Observasi  dilakukan  untuk  mengamati  kegiatan  guru  dan  siswa  dalam
proses  pembelajaran.  Observasi  dilaksanakan  siswa  secara  langsung yang berarti mengadakan pengamatan secara langsung terhadap subjek
yang diteliti.
J.  Teknik Pemeriksaan Kepercayaan
Uji  coba  dilakukan  setelah  perangkat  tes  disusun,  untuk  mengetahui validitas,  tingkat  kesukaran  soal,  daya  beda  soal,  dan  reliabilitas.  Setelah
perangkat  tes  diuji  cobakan,  langkah  selanjutnya  dilakukan  analisis  dengan tujuan  supaya  instrumen  yang  dipakai  untuk  memperoleh  data  benar-benar
dapat diandalkan dan dapat dipercaya. Analisis perangkat uji coba meliputi:
1.  Validitas
Validitas  adalah  suatu  ukuran  yang  menunjukkan  tingkat  kevalidan  atau kesahihan suatu instrumen. Sebuah instrumen dikatakan valid apabila mampu
mengukur apa yang diinginkan. Teknik  uji  coba  validitas  yang  digunakan  dalam  penelitian  ini  adalah  uji
valid instrumen dengan menggunakan teknik rumus korelasi. Dikatakan  valid  jika  hasil  perhitngan  memperoleh  koefisien  korelasi
Rumus Product Moment dari Pearson:
46
} }{
{
2 2
2 2
Y Y
N X
X N
Y X
XY N
r
xy
46
Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, Jakarta : Bumi Aksara,2009 , h.72
Keterangan: N:  banyaknya peserta tes
X:  skor butir soal Y:  skor total
x y
r
: koefisien korelasi antara variabel X dan Y
2.  Tingkat Kesukaran Soal
Soal  yang  baik  adalah  soal  yang  tidak  terlalu  mudah  atau  tidak  terlalu sukar.
47
Rumus yang digunakan :
Keterangan : P = Tingkat kesukaran
B = Banyaknya siswa yang menjawab benar JS = Jumlah seluruh siswa peserta tes
Indeks  kesukaran  ini  diberi  simbol  P  p  besar,  singkatan  dari  kata “proporsi”. Indeks kesukaran dapat diklasifikasikan sebagai berikut:
Soal dengan P 0,00 sampai 0,30 adalah soal sukar Soal dengan P 0,30 sampai 0,70 adalah soal sedang
Soal dengan P 0,70 sampai 1,00 adalah soal mudah
3.  Daya Pembeda Soal
Daya  pembeda  soal  adalah  kemampuan  suatu  soal  untuk  membedakan antara  siswa  yang  pandai  berkemampuan  tinggi  dengan  siswa  yang  bodoh
berkemampuan  rendah.  Rumus  untuk  menentukan  indeks  diskriminasi adalah:
48
47
Ibid h. 208
48
Ibid. h. 213-214
Keterangan: D = Daya pembeda soal
BA = Banyaknya peserta kelompok atas yang menjawab benar BB = Banyaknya peserta kelompok bawah yang menjawab benar
JA = banyaknya peserta kelompok atas JB = Bnyaknya peserta kelompok bawah
P
A
= JA
BA = Proporsi peserta kelompok atas yang menjawab benar
P
B
= JB
BB = Proporsi peserta kelompok bawah yang menjawab benar
0,00 ≤ D ≤ 0,20 : Jelek 0,21 ≤ D ≤ 0,40 : Cukup
0,41 ≤ D ≤ 0,70 : Baik 0,71 ≤ D ≤ 1,00 : Baik Sekali
D : negatif, semuanya tidak baik, jika semua butir soal yang mempunyai nilai D negatif sebaiknya dibuang.
4.  Reliabilitas
Reliabilitas  adalah  keajegan  atau  ketetapan.  Suatu  tes  dapat  dikatakan mempunyai taraf kepercayaan tinggi jika tes tersebut dapat memberikan hasil
yang tetap. Reliabilitas  menunjukkan  pada  suatu  pengertian  bahwa  suatu  instrument
cukup  dapat  dipercaya  untuk  digunakan  sebagai  alat  pengumpulan  data. Instrumen  yang  sudah  dapat  dipercaya  atau  reliabel  akan  menghasilkan  data
yang  dapat  dipercaya  juga.  Mencari  reliabilitas  instrument  dengan menggunakan rumus KR-20:
49
Keterangan:
49
Ibid.h.101