1.4.2 Membuktikan urutan pengerjaan
hitung. 27, 28, 29,
30
F. Teknik Analisis Data
Dalam penelitian ini, data yang diperoleh akan dianalisis secara kualitatif dan kuantitatif. Data kualitatif adalah hasil dari wawancara guru
dan masukan dari para ahli saat validasi, sedangkan data kuantitatif berupa validasi produk oleh ahli dan hasil analisis butir soal.
1. Data Kualitatif
Data kualitatif didapatkan dari wawancara yang dilakukan peneliti kepada guru kelas III Sekolah Dasar. Data juga diperoleh dari empat
validator ahli, para ahli memberikan komentar dan saran mengenai produk yang dibuat peneliti. Dari data wawancara guru dan para ahli,
dianalisis yang berupa kesimpulan agar menjadi acuan peneliti guna memperbaiki produk.
2. Data Kuantitatif
Data kuantitatif digunakan untuk menilai kelayakan dari produk tes hasil belajar. Data kuantitatif didapatkan dari hasil validasi dari para
ahli dan analisis butir soal. Data dari analisis butir soal akan dihitung validitas, reliabilitas, daya pembeda, tingkat kesukaran, dan pengecoh.
a. Hasil Validator Ahli
Peneliti menganalisis data dengan cara menghitung rata-rata yang diberikan oleh para ahli. Berikut ini adalah kriteria skor untuk
menilai lembar kuesioner yang dibagikan oleh para ahli yaitu dengan skala empat menurut Ardiani dalam Widoyoko, 2014: 69:
Tabel 3.4 Kriteria Skor Skala Empat
Interval tingkat pencapaian
Kualifikasi 3,25 M
≤ 4,00 Sangat Baik SB
2,50 M ≤ 3,25
Baik B 1,75 M
≤ 2,50 Kurang Baik KB
0,00 M ≤ 1,75
Tidak Baik TB Keterangan:
M = Rata-rata skor pada setiap aspek yang dinilai Pada penelitian ini peneliti tidak mengubah soal yang masuk dalam
kategori “sangat baik”, peneliti memperbaiki soal sesuai dengan saran yang diberikan oleh validator jika soal masuk dalam
klasifikasi “baik” dan “kurang baik”, peneliti akan mengganti soal jika soal masuk dalam klasifikasi “tidak baik”.
b. Analisis Butir Soal
1 Validitas
Suatu alat ukur dinyatakan sah valid jika alat ukur tersebut benar-benar mampu memberikan informasi empiris
sesuai dengan apa yang diukur Subali, 2012: 107. Sedangkan menurut Sudijono 2009: 258 validasi dari suatu tes dapat
dicari dengan menggunakan rumus, salah satunya rumus korelasi point bisserial. Berikut ini rumus yang digunakan:
r
pbi =
−
St p
Keterangan : = Koefisien korelasi bisserial
= Rerata dari subjek yang menjawab benar = Rerata skor total
= Standar deviasi dari skor total proporsi P
= Proporsi siswa yang menjawab jawaban benar =
ℎ ℎ
= Proporsi siswa yang menjawab salah q = 1-q
Analisis uji validitas dilakukan dengan mengolah data dalam program aplikasi TAP. Nilai validasi dalam aplikasi
TAP dapat dilihat pada nilai Point Bisserial. Peneliti menentukan validitas dengan cara membandingkan r hitung
soal pada aplikasi TAP Point Bisserial dengan r tabel dengan taraf signifikan 5 untuk jumlah siswa 30 orang sebesar 0,355.
Soal yang termasuk valid jika validitas hitung r hitung melebihi r tabel signifikan 5 valid apabila r hitung 0,361
untuk responden 30, dan r hitung 0,355 untuk responden 31. Peneliti menggunakan taraf signifikan 5 karena pada
penelitian pendidikan taraf signifikan 5 sudah dapat dikatakan layak untuk dijadikan alat ukur.
Alasan r hitung hasil TAP dikorelasikan dengan r tabel, adalah bahwa penguji validitas menggunakan statistik korelasi
suatu tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriteria dalam arti kesejajaran antara hasil tes dan
kriteria Purwanto, 2016: 116. Jadi antara hasil r hitung harus dikorelasikan dengan r tabel. Berikut ini patokan yang dapat
digunakan untuk menentukan tingkat validitas suatu instrumen tes Arikunto, 2013: 89:
Tabel 3.5 Kategori Tingkat Validitas Tes
Nilai r Kategori
0,00 – 0,200 Sangat Rendah
0,200 – 0,400 Rendah
0,400 – 0,600 Cukup
0,600 – 0,800 Tinggi
0,800 – 1,00 Sangat Tinggi
Namun dalam penelitian ini produk yang dianalisis hanya ditentukan valid atau tidak valid, dengan mengacu pada
korelasi antara r hitung dan r tabel. Berikut ini hasil validitas yang menggunakan teknik program TAP:
Gambar 3.3 hasil validitas pada program TAP 2
Reliabilitas Sebuah tes dikatakan reliabel apabila hasil pengukuran
dilakukan dengan menggunakan tes tersebut secara berulang- ulang terhadap subjek yang sama, senantiasa menunjukkan
hasil yang tetap sama atau sifatnya stabil Sudjiono, 2010: 95. Menurut Widoyoko 2014: 140 sebuah tes memiliki tingkat
reliabilitas tinggi jika memberikan hasil yang sama atau tetap apabila diteskan berulang kali dengan responden yang sama.
Pada penelitian ini reliabilitas instrumen soal yang digunakan adalah dengan “Split – Half Method”, yaitu suatu tes dibagi
menjadi 2 sebagian yang sama tingkat kesukarannya, sama isi dan bentuknya. Peneliti membagi dua bagian tes ini
berdasarkan nomor item soal ganjil – genap. Selanjutnya untuk metode ini digunakan dua rumus yaitu:
Menggunakan rumus produk momen dengan angka kasar: R
xy
= −
2
−
2
}
2
−
2
}
Keterangan: R
xy
= Koefisien korelasi antara variabel XY X
= Skor butir soal ganjil Y
= Skor butir soal genap N
= Jumlah responden Menurut Purwanto 2014: 164 bahwa R
xy
merupakan hasil korelasi skor belahan awal dan akhir. Angka korelasi yang
diperoleh merupakan korelasi antar setengah instrumen, karena skor diperoleh dari hasil pembelahan butir menjadi dua bagian.
Koefisien reliabilitas merupakan koefisien reliabilitas penuh, sehingga koefisien reliabilitas yang telah didapat menggunakan
langkah pertama, harus diubah menjadi koefisien reliabilitas penuh R
xy
Purwanto, 2016: 164. Berikut ini rumus untuk mengubahnya menggunakan rumus Sperman Brown seperti di
bawah ini: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
11
= 2
1 2
1 2
1 +
1 2
1 2
Keterangan:
11
= Koefisien reliabilitas penuh instrumen
1 2
1 2
= Koefisien reliabilitas setengah instrumen Penentuan dari koefisien reliabilitas pada penelitian ini
dengan menggunakan olah data pada program aplikasi TAP Test Analysis Program. Peneliti menggunakan reliabilitas
metode Flanagan. Menurut Purwanto 2014: 165 metode ini
merupakan salah satu metode penentuan reliabilitas dengan membagi data menjadi dua belahan yaitu ganjil dan genap.
Berdasarkan pernyataan tersebut peneliti menggunakan metode belah dua ganjil genap, karena skor yang diperoleh antara
belahan pertama dan kedua dimungkinkan tidak jauh berbeda, hal ini disebabkan oleh tingkat kesukaran yang relatif sama
antara belahan pertama dan kedua. Berikut ini adalah kriteria rentang skor reliabilitas menurut Sutrisno dalam Ratnawulan
dan Rusdiana, 2015: 175: Tabel 3.6 Kategori Tingkat Reliabilitas Tes
Nilai r Kategori
0,80 – 1,00 Sangat Tinggi
0,60 – 0,79 Tinggi
0,40 – 0,59 Cukup
0,20 – 0,39 Rendah
0,00 – 0,19 Sangat Rendah
Peneliti menetapkan item yang digunakan yaitu item yang mencapai minimum 0,40 atau dengan kategori Cukup. Berikut
ini hasil reliabilitas yang menggunakan teknik program TAP: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 3.4 hasil reliabilitas pada program TAP 3
Daya Pembeda Menurut Kusaeri 2014: 107 daya pembeda merupakan
kemampuan soal membedakan siswa yang pandai dan kurang pandai. Berikut ini adalah cara menghitung daya pembeda
menurut Kusaeri 2014: 108 :
=
−
1 2
Keterangan: DP = Daya Pembeda
BA = Jumlah jawaban benar pada kelompok atas BB = Jumlah jawaban benar pada kelompok bawah
N = Jumlah siswa yang mengerjakan tes Klasifikasi daya beda menurut Arikunto 2012: 232 yang
dipakai oleh peneliti adalah sebagai berikut:
Tabel 3.7 Klasifikasi Daya Beda Rentang Nilai
Kategori
0,00 – 0,20 Jelek
0,21 – 0,40 Cukup
0,41 – 0,70 Baik
0,71 – 1,00 Baik Sekali
Peneliti menetapkan item yang digunakan yaitu item yang mencapai minimum 0,41 atau dengan kategori Baik. Berikut ini
hasil daya beda yang menggunakan teknik program TAP: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 3.5 hasil daya beda pada program TAP 4
Tingkat Kesukaran Soal dapat dikatakan baik jika tidak terlalu mudah dan tidak
terlalu sulit. Soal yang terlalu mudah tidak merangsang siswa untuk berusaha semaksimal mungkin untuk memecahkannya.
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut indeks kesukaran difficulty index. Besarnya indeks
kesukaran antara 0,00 – 1,0. Indeks kesukaran ini menunjukkan taraf kesukaran soal.
Menurut Arikunto 2012: 223 Soal dengan indeks kesukaran 0,0 menunjukkan bahwa soal sukar,
sebaliknya indeks 1,0 menunjukkan bahwa soal terlalu mudah. Kusaeri 2014: 106 menjelaskan bahwa cara berhitung tingkat
kesukaran untuk soal pilihan ganda dengan menggunakan rumus sebagai berikut:
Tingkat kesukaran =
ℎ ℎ
Untuk mengetahui
tingkat kesukaran
soal peneliti
menggunakan aplikasi TAP. Setelah peneliti mengetahui
tingkat kesukaran, soal yang valid dikategorikan dalam tiga kelompok yaitu mudah, sedang, dan sukar. Hal ini diperkuat
oleh Ratnawulan dan Rusdiana 2015: 163 yang berpendapat bahwa tingkat kesukaran pada umumnya dinyatakan dalam
suatu bentuk proporsi yang besarnya berkisar 0,00 – 1,00. Semakin besar indeks tingkat kesukaran berarti semakin mudah
soal tersebut. Berikut indeks tingkat kesukaran Ratnawulan dan Rusdiana, 2015: 164:
Tabel 3.8 Indeks Tingkat Kesukaran
Indeks tingkat kesukaran Kategori
0,00 – 0,30 Soal tergolong sukar
0,31 – 0,70 Soal tergolong sedang
0,71 – 1,00 Soal tergolong mudah
Tingkat kesukaran yang baik pada suatu tes adalah 25 “mudah”, 50 “sedang” dan 25 “sukar” Widoyoko 2014:
136. Oleh karena itu, tingkat kesukaran pada tes hasil belajar yang dibuat peneliti ini diharapkan sesuai kurva normal, yaitu
25 “mudah”, 50 “sedang” dan 25 “sukar”. Berikut ini hasil validitas yang menggunakan teknik program TAP:
Gambar 3.6 hasil tingkat kesukaran pada program TAP 5
Pengecoh Pengecoh dihadirkan dengan tujuan menyesatkan siswa
sehingga tidak memilih jawaban yang benar melainkan memilih jawaban yang salah. Pengecoh dapat dikatakan
berfungsi baik apabila paling sedikit dipilih oleh 5 peserta tes dan lebih banyak dipilih oleh kelompok siswa yang kurang
pandai Kusaeri, 2014: 109. Sedangkan Arikunto 2012: 234 menjelaskan bahwa pengecoh jawaban akan berfungsi baik jika
dipilih 5 atau sebanyak ≥ 0,05. Sedangkan menurut
Surapranata 2009: 43 apabila pengecoh dipilih merata dapat dikatakan sangat baik. Namun, jika pengecoh itu dipilih lebih
banyak oleh kelompok atas dibanding bawah maka pengecoh itu menyesatkan.
Berdasarkan teori di atas, peneliti menyimpulkan bahwa pengecoh dikatakan berfungsi baik apabila pilihan jawaban
paling sedikit dipilih oleh 5 peserta tes dan lebih banyak dipilih oleh kelompok siswa yang kurang pandai. Berikut ini
hasil validitas yang menggunakan teknik program TAP:
Gambar 3.7 hasil pengecoh pada program TAP PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
55
BAB IV HASIL PENELITIAN DAN PEMBAHASAN
A. Hasil Penelitian
Penelitian ini berisi tentang hasil dari langkah-langkah pengembangan tes hasil belajar dan kualitas tes yang telah dilakukan.
1. Langkah-langkah Penelitian dan Pengembangan
Pengembangan tes hasil belajar ini berdasarkan kompetensi dasar melakukan perkalian pembagian yang hasilnya bilangan tiga angka
dan melakukan pengerjaan hitung campuran untuk siswa Sekolah Dasar
kelas III. Langkah-langkah pengembangan dijabarkan sebagai berikut:
a. Potensi dan Masalah
Peneliti menemukan masalah melalui wawancara kepada guru kelas III SD Jetis Bantul pada tanggal 5 Juni 2016. Hasil
wawancara peneliti mendapat potensi untuk mengembangkan tes hasil belajar matematika. Wawancara yang dilakukan peneliti pada
guru terkait dengan tes hasil belajar yang dibuat guru. Guru kelas hanya sekedar membuat soal selanjutnya diberikan kepada siswa
tanpa mengetahui kualitas dan menganalisisnya seperti validitas, reliabilitas, dan analisis butir soal. Guru juga jarang membuat kisi-
kisi terlebih dahulu sebelum membuat soal. Hasil dari wawancara, peneliti juga mendapati informasi bahwa guru kelas yang
memberikan soal terkadang hanya mengambil soal dari LKS yang sudah disediakan dari sekolah. Selain wawancara, peneliti juga