penunjang penelitian menggunakan instrumen non tes berupa lembar observasi siswa selama pembelajaran berlangsung.
1. Instrumen Tes
Instrumen tes yang digunakan dalam penelitian ini adalah tes tertulis dalam bentuk pilihan ganda sebanyak 20 soal dengan 5 alternatif jawaban a,
b, c, d, e. Skor yang digunakan adalah satu 1 untuk tiap butir soal yang dijawab dengan benar dan nol 0 untuk tiap butir soal yang hasil jawabannya
salah. Instrumen yang digunakan dalam pretest dan posttest ini yaitu tes yang
berupa soal penguasaan konsep yang disusun dengan bimbingan dosen pembimbing kemudian dilakukan judgement oleh dua orang dosen Jurusan
Pendidikan Fisika UIN Syarif Hidayatullah Jakarta dan seorang guru mata pelajaran Fisika di SMA Negeri 3 Rangkasbitung. Soal pretest dan posttest
diujikan di kelas selain kelas eksperimen yang masih dalam populasi penelitian. Mengingat pentingnya kualitas alat pengambil data maka
instrumen yang digunakan harus baik, sehingga data yang diperoleh adalah data yang sebenarnya. Untuk itu perlu adanya uji validitas, reliabilitas, daya
pembeda dan tingkat kesukaran terhadap instrumen yang digunakan.
1 Validitas Butir Soal Instrumen
Validitas adalah suatu ukuran yang menunjukkan tingkat kevalidan atau kesahihan suatu instrumen yang digunakan dalam penelitian. Sebuah
instrumen dapat dikatakan valid apabila mampu mengukur sesuatu yang diinginkan dan dapat mengungkapkan data yang diteliti dengan tepat. Nilai
validitas untuk masing-masing soal yang telah diujikan dapat ditentukan dengan menentukan koefisien korelasi point biserial
sebagai berikut:
8
q p
SD M
M
t t
p
− =
pbi
r
8
Subana, dkk. Statistik Pendidikan Cet. II Bandung: Pustaka Setia, 2005, h.156 – 157.
dimana: r
pbi
= indeks point biserial M
p
= Mean rata-rata skor yang dijawab betul oleh testee peserta tes pada butir soal yang sedang dicari korelasinya dengan tes
secara keseluruhan. M
t
= Mean rata-rata skor yang dijawab salah oleh testee peserta tes pada butir soal yang sedang dicari korelasinya dengan tes
secara keseluruhan. SD
t
= Deviasi standar skor total. p
= proporsi testee yang menjawab betul terhadap butir soal yang sedang diuji validitasnya.
q = proporsi testee yang menjawab salah terhadap butir soal yang
sedang diuji validitasnya.
Tabel 3.2 Interpretasi Validitas Butir Soal
9
Nilai r
pbi
Interpretasi Validitas
0,800 - 1,00 Sangat tinggi
0,60 - 0,799 Tinggi
0,40 - 0,599 Cukup
0,20 - 0,399 Rendah
0,00 - 0,20 Sangat rendah
Berdasarkan hasil perhitungan, diperoleh data bahwa dari 35 soal yang diujicobakan terdapat 21 soal yang dinyatakan valid, nilai yang
didapat dari 21 butir soal yang valid yaitu sebesar 0.44.
10
Diantara 21 soal yang valid ini selanjutnya akan disaring kembali berdasarkan kriteria
lainnya untuk dapat digunakan dalam penelitian ini.
9
Riduwan, Belajar Mudah Penelitian untuk Guru-Karyawan dan Peneliti Pemula, Bandung: Alfabeta, 2007, h.7
10
Perhitungan lengkap dapat dilihat pada lampiran A.1.3.
2 Reliabilitas Instrumen
Reliabilitas adalah kestabilan skor yang diperoleh dengan melakukan tes terhadap orang yang sama ketika diuji ulang dengan tes yang sama
pada situasi berbeda. Nilai reliabilitas diperoleh dengan menentukan koefisien reliabilitas tes. Salah satu cara yang dapat digunakan untuk
menunjukkan reliabilitas suatu instrumen tes adalah teknik belah dua.
11
Dalam teknik ini, tes yang telah diberikan dibagi menjadi dua bagian. Kemudian tiap-tiap bagian diberikan skor secara terpisah. Terdapat dua
prosedur yang dapat digunakan untuk membelah menjadi dua bagian sebuah tes, yaitu:
a. Prosedur Ganjil-Genap. Pelaksanan prosedur ini adalah seluruh butir
soal tes yang bernomor ganjil dikumpulkan menjadi satu kelompok, begitu pula dengan butir soal yang bernomor genap.
b. Prosedur secara random acak.
Untuk mencari reliabilitas seluruh tes digunakan rumus Spearman Brown
sebagai berikut:
12
dimana: r
n
= koefisien korelasi seluruh tes N
= perbandingan antara panjang tes secara keseluruhan dengan panjang tes yang dikorelasikan
r
1 2
= koefisien korelasi antara sebagian tes dengan bagian tes lainnya
Metode yang digunakan dalam perhitungan reliabilitas ini adalah metode ganjil-genap. Berdasarkan perhitungan tersebut diperoleh bahwa
11
Wayan Nurkancana dan P.P.N. Sumartana, Evaluasi Pendidikan Cet. IV Surabaya: Usaha Nasional, 1986, h.132 .
12
Ibid. h. 133.
nilai reliabilitas instrumen tes ini adalah 0,898 atau 0,90.
13
Nilai ini termasuk kategori tinggi. Oleh karena itu, dapat disimpulkan instrumen ini
layak untuk digunakan dalam penelitian ini.
Tabel 3.3 Interpretasi Reliabilitas Soal
14
Nilai r
1112
Interpretasi Reliabilitas
0,90
≤ r
11
≤ 1,00 Sangat tinggi
0,70
≤ r
11
0,90 Tinggi
0,40
≤ r
11
0,70 Sedang
0,20
≤ r
11
0,40 Rendah
r
11
0,20 Sangat rendah
3 Tingkat Kesukaran
Tingkat kesukaran suatu butir soal adalah proporsi dari keseluruhan siswa yang menjawab benar pada butir soal tersebut. Tingkat kesukaran
dapat diperoleh dengan persamaan sebagai berikut:
15
Keterangan: P
= indeks kesukaran B
= banyaknya siswa yang menjawab soal dengan benar Js
= jumlah seluruh siswa Interpretasi yang lebih rinci mengenai nilai-nilai tk dibagi ke dalam
kategori-kategori sebagai berikut:
13
Perhitungan lengkap dapat dilihat pada lampiran A.1.4.
14
Riduwan. Op. Cit., h. 8.
15
Subana dan Sudrajat. Dasar-dasar Penelitian Ilmiah, h.133.
Tabel 3.4 Interpretasi Tingkat Kesukaran
16
Nilai P
Interpretasi Tingkat Kesukaran
0,00 P ≤ 0,30
Sukar
0,30 P ≤ 0,70
Sedang
0,70 P 1,00
Mudah Dari hasil perhitungan tingkat kesukaran, terdapat 14 butir soal
termasuk kategori sukar, 16 butir soal termasuk kategori sedang, dan 5 butir soal termasuk kategori mudah.
17
4 Daya Pembeda
Daya pembeda butir soal adalah kemampuan suatu soal untuk membedakan siswa yang pandai berkemampuan tinggi dengan siswa
yang kurang pandai berkemampuan rendah.
18
Uji coba soal dilakukan terhadap jumlah sampel yang akan diteliti, sehingga kelompok atas dan
kelompok bawah diperoleh dengan membagi dua jumlah siswa sama besar. Persamaan daya pembeda soal sebagai berikut:
19
Keterangan: DP = daya pembeda
BA = banyaknya peserta kelompok atas yang menjawab soal dengan benar BB = banyaknya peserta kelompok bawah yang menjawab soal dengan
benar JA = banyaknya peserta kelompok atas
JB = banyaknya peserta kelompok bawah
16
Riduwan. Op Cit, h. 8.
17
Perhitungan lengkap dapat dilihat pada lampiran A.1.5.
18
Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, Jakarta: PT Bumi Aksara. 2008, Cet ke-8, edisi Revisi. h. 211.
19
Subana dan Sudrajat. Op Cit, h.134-135.
interpretasi yang lebih rinci mengenai nilai-nilai DP dibagi ke dalam kategori-kategori sebagai berikut:
Tabel 3.5 Interpretasi Daya Pembeda Soal
20
Nilai dp
Interpretasi Daya Pembeda Soal
0,70 dp
≤ 1,00 Sangat baik
0,40 dp
≤ 0,70 Baik
0,20 dp
≤ 0,40 Cukup
0,00 dp
≤ 0,20 Jelek
dp = 0,00
Sangat jelek
Berdasarkan hasil perhitungan daya pembeda soal, diperoleh data dengan kategori baik sekali sebanyak 5 butir soal, kategori baik sebanyak 15 butir
soal, kategori cukup sebanyak 2 butir soal, kategori jelek 9 butir soal, dan kategori sangat jelek drop sebanyak 4 butir soal.
21
2. Instrumen Non tes