Kalibrasi Instrumen METODOLOGI PENELITIAN

q p St Mt Mp rpbis   Keterangan : Rpbis : Koefisien korelasi point biseral Mp : Mean skor dari subjek-subjek yang menjawab benar item yang dicari korelasinya dengan tes Mt : Mean skor total skor rata-rata dari seluruh pengikut tes skor item ke-1 yang dicari validitasnya St : Standar deviasi skor total P : Proporsi subjek yang menjawab benar item tersebut Q : 1-p Kriteria validitas adalah sebagai berikut:  Antara 0,8 00 sampai dengan 1, 00 : sangat tinggi  Antara 0,6 00 sampai dengan 8, 00 : tinggi  Antara 0,4 00 sampai dengan 6, 00 : cukup  Antara 0,2 00 sampai dengan 4, 00 : rendah  Antara 0,0 00 sampai dengan 2, 00 : sangat rendah Setelah didapatkan r hitung , maka dibandingkan dengan r tabel dengan taraf signifikansi α 5 r total = 0,273 dengan n=50. Jika r hitung lebih besar atau sama dengan dari r tabel r hitung ≥ r tabel , maka soal tersebut valid. Sedangkan jika r hitung lebih kecil atau sama dari r tabel r hitung ≤ r tabel maka soal tersebut tidak valid. Setelah diuji cobakan terhadap anak sebanyak 50 siswa, ternyata dari 32 item soal terdapat 25 item soal yang valid yaitu di atas r tabel =0,273, dan terdapat 7 item soal yang tidak valid yaitu dibawah r tabel =0,273.

2. Reliabilitas

Reliabilitas Reliability bermakana keterpercayaan, keterandalan, keajegan, kestabilan, atau konsistensi dapat diartikan sejauh mana hasil pengukuran dapat dipercaya dan konsisten atau secara umum pengertian reliabilitas alat ukur dan reliabilitas hasil ukur dianggap sama, sekalipun penggunaannya sedikit berbeda. 3 Jadi, yang dipentingkan disini adalah ketelitiannya, sejauh mana tes atau alat tersebut dapat dipercaya kebenarannya. Untuk menentukan reliabilitas alat tes, digunakan rumus K-R 20 Kuder- Richardson 4 sebagai berikut:                   2 2 1 St pq St n n Rii Keterangan : Rii : Reliabilitas P : Proporsi subjek yang menjawab item soal yang benar Q : Proporsi subjek yang menjawab item soal yang salah q=1-p N : Banyak butir soal  pq : Jumlah hasil perkalian antara p dan q St 2 : Varians total Berdasarkan perhitungan diperoleh harga r hitung sebesar 0,90, harga r hitung , kemudian dikonsultasikan dengan r tabel pada product moment. Pada tabel tersebut N=32 dengan taraf signifikansi α 5 =.0,273. Diperoleh nilai hasil perhitungan r hitung lebih besar dibandingkan dengan nilai r pada tabel r tabel atau r hitung ≥ r tabel sehingga dapat disimpulkan bahwa intrumen yang digunakan dalam penelitian ini memenuhi syarat reliabel. Dengan kata lain setelah diujicobakan sebanyak 32 item soal terhadap 50 siswa, ternyata didapat tingkat reliabilitas soal sebesar 0,90. Terbukti bahwa r hitung ≥ r tabel yaitu, r hitung sebesar 0,90 lebih besar dari r tabel sebesar 0,273, berarti soal tersebut dinyatakan reliabel. 3 Ahmad Sofyan, dkk, Evaluasi Pembelajaran IPA Berbasis Kompetensi, Jakarta : UIN Jakarta Press 2006. Cet. Ke-1, h. 105 4 Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, Jakarta: Bumi Aksara, 2003

3. Pengujian Taraf Kesukaran

Untuk menentukan apakah soal itu sukar, sedang, atau mudah maka soal- soal tersebut diujikan taraf kesukarannnya lebih dahulu. Pengujian taraf kesukaran ini menggunakan rumus 5 sebagai berikut: N B I  Keterangan : I : Indeks Kesulitan untuk tiap butir soal B : Banyaknya siswa yang menjawab benar untuk setiap butir soal N : Banyaknya siswa yang memberikan jawaban pada soal yang dimaksud Kriteria indesk kesukaran : 0,0 - 0,3 = Sukar 0,31 - 0,7 = Sedang 0,71 - 1,0 = Mudah Berdasarkan hasil uji taraf kesukaran terhadap 32 item soal, menghasilkan 1 item soal dengan kategori mudah, dan 21 item soal dengan kategori sedang, serta 10 item soal dengan kategori sukar.

4. Daya Pembeda

Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai berkemampuan tinggi dengan siswa yang bodoh berkemampuan rendah 6 . Adapun rumus untuk menentukan indek diskriminasi atau daya pembeda 7 adalah sebagai berikut: PB PA JB BB JA BA D     5 Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, Jakarta: Bumi Aksara, 2003 6 Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, Jakarta: Bumi Aksara, 2003 7 Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, Jakarta: Bumi Aksara, 2003 Keterangan : D : Jumlah peserta test JA : Jumlah peserta kelompok atas JB : Jumlah peserta kelompok bawah BA : Banyaknya peserta keompok atas yang menjawab soal itu dengan benar BB : Banyaknya peserta keompok bawah yang menjawab soal itu dengan benar JB BB PA  : Banyaknya peserta kelompok atas yang menjawab benar JA BA PB  : Banyaknya peserta kelompok bawah yang menjawab benar Klasifikasi daya pembeda: D : 0,00 – 0,20 = Jelek D : 0,20 – 0,40 = Cukup D : 0,40 – 0,70 = Baik D : 0,70 – 1,00 = Baik Sekali D : Negatif, semuanya tidak baik, jadi semua butir soal yang mempunyai nilai negatif sebaiknya dibuang saja. Butir-butir soal yang baik yaitu butir soal yang mempunyai indeks diskriminasi 0,4 – 0,7. 8 Hasil uji daya pembeda pada 32 item soal menghasilkan 8 item soal dengan kriteria daya pembeda jelek, 10 item soal dengan kriteria cukup, dan 14 item soal dengan kriteria baik.

H. Teknik Analisis Data

Data yang diambil dalam penelitian ini adalah hasil dari jawaban siswa terhadap instrumen tes Biologi, kemudian dianalisis dengan cara menghitung nilai dan menghitung persentase atau jumlah siswa yang menjawab benar dan jumlah siswa yang menjawab salah pada setiap item soal. Soal yang dijawab salah oleh 8 Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, Jakarta: Bumi Aksara, 2003 sebagian siswa diduga soal tersebut dianggap sulit oleh siswa. Untuk membuktikannya kemudian dilakukan analisis terhadap siswa yang memperoleh nilai di bawah 65 terhadap soal yang dianggap sulit tersebut. Skor yang diperoleh peserta didik adalah banyaknya butir soal yang dijawab benar. Dengan menggunakan rumus penskoran, 9 sebagai berikut : 100 x N B Skor  Keterangan : B : Butir Soal yang dijawab benar N : Banyaknya butir Soal Setelah dilakukan penskoran terhadap data tes tersebut, kemudian dianalisis dengan cara menghitung persentase kesulitan belajar siswa dilihat dari aspek yang dinilai yaitu berupa aspek ingatan C 1 dan aspek pemahaman C 2 dengan menjumlahkan seluruh jawaban yang benar, dibagi dengan jumlah banyaknya siswa kemudian dikalikan 100. Dengan menggunakan rumus persentase sebagai berikut : 100 x N B   Keterangan : B  : Jumlah jawaban yang benar N : Jumlah banyaknya siswa Setelah diperoleh jumlah nilai dalam bentuk persentase, kemudian dalam menginterpretasikan skor mentah menjadi nilai, penulis menggunakan pendekatan PAP sebagai alat untuk menguji tingkat penguasaan, yang bersifat mutlak. Pendekatan PAP dapat diimplementasikan dengan cara skor yang diperoleh siswa dibandingkan dengan tingkat pencapaian penguasaan siswa sesuai dengan tujuan yang telah ditetapkan. Untuk perhitungannya, pertama-tama skor mentah 9 Mimin Haryati, Sistem Penilaian Berbsis Kompetensi, Jakarta : Gaung Persada Pers, 2006 Cet. Ke-1, h. 63