Valid tidaknya  instrumen  yang disusun dan di try out kepada kelompok uji coba. Teknik  yang  digunakan untuk menguji  validitas butir menggunakan rumus  yaitu:
korelasi biserial titik yaitu:
q p
S M
M r
t t
p pbis
 
Subino, 1997:106 Keterangan:
M
p
=  Rata-rata skor total yang menjawab benar pada butir soal
M
t
=  Rata-rata skor soal
S
t
=  Standart deviasi skor total
p
=  Proposi siswa yang menjawab benar  pada setiap butir soal
q
=  Proposi siswa yang menjawab benar  pada setiap butir soal Berdasarkan hasil try out perhitungan pada N = 36 diperoleh r
pbis
, r hitung sebesar 0, 689 lebih besar dari
r
tabel
=0, 392 pada taraf signifikan 5, karena r
pbis
lebih  besar  dari
r
tabel
dianggap  valid,  maka  instrument  dapat  tersebut  dapat digunakan  untuk  penelitian
mengambil  data. Perhitungan  validitas  butir  dapat
dilihat di lampiran halaman 163.
Jumlah  soal  yang diuji coba sebanyak 50 butir soal dan diperoleh 40 soal yang  valid  dan  10  soal  tidak  valid.  Jumlah  soal  yang  valid  dan  tidak  valid  dapat
dilihat pada lampiran halaman 162.
3.8.2.2 Reabilitas soal kemampuan awal
Reliabilitas  menunjukkan  pada  suatu  pengertian  bahwa  suatu  instrumen cukup  dapat  dipercaya  untuk  digunakan  sebagai  alat  pengumpul  data  karena
instrumen  tersebut  masih  baik  Suharsimi  Arikunto,  2010:  221.  Reliabilitas
menunjukkan  bahwa  suatu  korelasi  point  biserial  untuk  digunakan  sebagai pengumpul  data.  Dalam  arti suatu perangkat  tes  tiap  kali  digunakan  memberikan
skor  yang relatif  sama untuk menguji reliabilitas  dalam penelitian  ini  digunakan rumus sebagai berikut:
 
 
 
 
 
 
 Vt
k M
- Mk
- 1
1 -
k k
r
11
Suharsimi, 2010: 232 Keterangan:
r
11
= Reliabilitas instrumen k
= Banyaknya butir soal atau butir pertanyaan. M
= Skor rata-rata V
t
= Varians total Suharsimi, 2010: 232.
Rumus varians:
 
n n
x x
S
i 2
2 2
 
 
Suharsimi, 2010:227 Harga  r
11
kemudian dikonsultasikan  dengan  tolak  ukur  reliabilitas  sebagai
berikut: Table 3.3 Klasifikasi Reliabilitas Tes Objektif
  0,00 ≤ r  0,20 = derajat reliabilitas sangat rendah
  0,02 ≤ r  0,40 = derajat reliabilitas rendah
  0,40 ≤ r  0,60 = derajat reliabilitas sedang
  0,60 ≤ r  0,80 = derajat reliabilitas tinggi
  0,08 ≤ r  1,00 = derajat reliabilitas sangat tinggi
Suharsimi, 2010: 232.
Berdasarkan try out pada N = 36 hasil 0, 905 lebih besar dari
r
tabel
= 0,092 pada taraf signifikan 5 , karena
r
11
lebih besar dari
r
tabel
maka dapat disimpulkan bahwa instrument tersebut reliabel.
Perhitungan reliabilitas insrumen dapat dilihat pada lampiran
halaman 165 .
3.8.2.3 Reliabilitas Tes Praktik
Suatu  instrumen  dikatakan  reliabel  apabila  instrumen  tersebut  dapat memberi  hasil  yang  tepat,  artinya  apabila  instrumen  tersebut  digunakan  pada
sejumlah  objek  yang  sama  pada  lain  waktu  maka  hasilnya  relatif  sama. Reliabilitas  tes  praktek  pada  penelitian  ini  menggunakan  reliabilitas  ratings.
Menurut  Saifuddin  Azwar,  2011:  105  menyatakan    ratings    adalah  prosedur pemberian  skor  berdasarkan  judgment  subjektif  terhadap  aspek  atau  atribut
tertentu  yang  dilakukan  melalui  pengamatan  sistematik  baik  secara  langsung maupun  tidak  langsung.  Hal  ini  bertujuan  untuk  meminimalkan  pengaruh
subjektivitas pemberian antar beberapa rater. Penelitian  ini  menggunakan  3  orang  panelis  ahli  pemberi  rating  rater.
Caranya,  yaitu  reliabilitas  hasil  pemberian  rating  dilakukan  dengan  memberikan rating ulang dan menghitung korelasi antara pemberi rating tersebut melalui rank
order  correlation atau korelasi  jenjang. Dari sini  akan ditemukan  koefisien  yang merupakan rata-rata interkorelasi hasil rating diantara semua kombinasi pasangan
rater yang dibuat dan merupakan rata-rata reliabilitas bagi seorang rater. Menurut  Ebel  1951  yang  dikutip  oleh  Saifuddin  Azwar  memberikan
formula  untuk  mengestimasi  reliabilitas  dari  rata-rata  rating  yang  dilakukan  oleh K orang raters, yaitu dengan rumus sebagai berikut:
r
xx
’ = S
s 2
– S
e 2
S
s 2
Kerangan: r
xx’
= Koefisien korelasi Ss
2
= Varians antar subyek yang dikenai rating Se
2
= Varians eror, yaitu varians interaksi antar subyek  s dan  rater  r Saifuddin Azwar, 2011: 106-107
Hasil  perhitungan  dari  ketiga  reter  adalah  =  0,837  dan  tergolong  tinggi, sehingga instrument tersebut reliabel dan dapat digunakan sebagai pengambil data
Perhitungan reliabilitas insrument dapat dilihat pada lampiran halaman 168.
3.8.2.4 Tingkat kesukaran