Hasil Validator Ahli Analisis Butir Soal

1.4.2 Membuktikan urutan pengerjaan hitung. 27, 28, 29, 30

F. Teknik Analisis Data

Dalam penelitian ini, data yang diperoleh akan dianalisis secara kualitatif dan kuantitatif. Data kualitatif adalah hasil dari wawancara guru dan masukan dari para ahli saat validasi, sedangkan data kuantitatif berupa validasi produk oleh ahli dan hasil analisis butir soal.

1. Data Kualitatif

Data kualitatif didapatkan dari wawancara yang dilakukan peneliti kepada guru kelas III Sekolah Dasar. Data juga diperoleh dari empat validator ahli, para ahli memberikan komentar dan saran mengenai produk yang dibuat peneliti. Dari data wawancara guru dan para ahli, dianalisis yang berupa kesimpulan agar menjadi acuan peneliti guna memperbaiki produk.

2. Data Kuantitatif

Data kuantitatif digunakan untuk menilai kelayakan dari produk tes hasil belajar. Data kuantitatif didapatkan dari hasil validasi dari para ahli dan analisis butir soal. Data dari analisis butir soal akan dihitung validitas, reliabilitas, daya pembeda, tingkat kesukaran, dan pengecoh.

a. Hasil Validator Ahli

Peneliti menganalisis data dengan cara menghitung rata-rata yang diberikan oleh para ahli. Berikut ini adalah kriteria skor untuk menilai lembar kuesioner yang dibagikan oleh para ahli yaitu dengan skala empat menurut Ardiani dalam Widoyoko, 2014: 69: Tabel 3.4 Kriteria Skor Skala Empat Interval tingkat pencapaian Kualifikasi 3,25 M ≤ 4,00 Sangat Baik SB 2,50 M ≤ 3,25 Baik B 1,75 M ≤ 2,50 Kurang Baik KB 0,00 M ≤ 1,75 Tidak Baik TB Keterangan: M = Rata-rata skor pada setiap aspek yang dinilai Pada penelitian ini peneliti tidak mengubah soal yang masuk dalam kategori “sangat baik”, peneliti memperbaiki soal sesuai dengan saran yang diberikan oleh validator jika soal masuk dalam klasifikasi “baik” dan “kurang baik”, peneliti akan mengganti soal jika soal masuk dalam klasifikasi “tidak baik”.

b. Analisis Butir Soal

1 Validitas Suatu alat ukur dinyatakan sah valid jika alat ukur tersebut benar-benar mampu memberikan informasi empiris sesuai dengan apa yang diukur Subali, 2012: 107. Sedangkan menurut Sudijono 2009: 258 validasi dari suatu tes dapat dicari dengan menggunakan rumus, salah satunya rumus korelasi point bisserial. Berikut ini rumus yang digunakan: r pbi = − St p Keterangan : = Koefisien korelasi bisserial = Rerata dari subjek yang menjawab benar = Rerata skor total = Standar deviasi dari skor total proporsi P = Proporsi siswa yang menjawab jawaban benar = ℎ ℎ = Proporsi siswa yang menjawab salah q = 1-q Analisis uji validitas dilakukan dengan mengolah data dalam program aplikasi TAP. Nilai validasi dalam aplikasi TAP dapat dilihat pada nilai Point Bisserial. Peneliti menentukan validitas dengan cara membandingkan r hitung soal pada aplikasi TAP Point Bisserial dengan r tabel dengan taraf signifikan 5 untuk jumlah siswa 30 orang sebesar 0,355. Soal yang termasuk valid jika validitas hitung r hitung melebihi r tabel signifikan 5 valid apabila r hitung 0,361 untuk responden 30, dan r hitung 0,355 untuk responden 31. Peneliti menggunakan taraf signifikan 5 karena pada penelitian pendidikan taraf signifikan 5 sudah dapat dikatakan layak untuk dijadikan alat ukur. Alasan r hitung hasil TAP dikorelasikan dengan r tabel, adalah bahwa penguji validitas menggunakan statistik korelasi suatu tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriteria dalam arti kesejajaran antara hasil tes dan kriteria Purwanto, 2016: 116. Jadi antara hasil r hitung harus dikorelasikan dengan r tabel. Berikut ini patokan yang dapat digunakan untuk menentukan tingkat validitas suatu instrumen tes Arikunto, 2013: 89: Tabel 3.5 Kategori Tingkat Validitas Tes Nilai r Kategori 0,00 – 0,200 Sangat Rendah 0,200 – 0,400 Rendah 0,400 – 0,600 Cukup 0,600 – 0,800 Tinggi 0,800 – 1,00 Sangat Tinggi Namun dalam penelitian ini produk yang dianalisis hanya ditentukan valid atau tidak valid, dengan mengacu pada korelasi antara r hitung dan r tabel. Berikut ini hasil validitas yang menggunakan teknik program TAP: Gambar 3.3 hasil validitas pada program TAP 2 Reliabilitas Sebuah tes dikatakan reliabel apabila hasil pengukuran dilakukan dengan menggunakan tes tersebut secara berulang- ulang terhadap subjek yang sama, senantiasa menunjukkan hasil yang tetap sama atau sifatnya stabil Sudjiono, 2010: 95. Menurut Widoyoko 2014: 140 sebuah tes memiliki tingkat reliabilitas tinggi jika memberikan hasil yang sama atau tetap apabila diteskan berulang kali dengan responden yang sama. Pada penelitian ini reliabilitas instrumen soal yang digunakan adalah dengan “Split – Half Method”, yaitu suatu tes dibagi menjadi 2 sebagian yang sama tingkat kesukarannya, sama isi dan bentuknya. Peneliti membagi dua bagian tes ini berdasarkan nomor item soal ganjil – genap. Selanjutnya untuk metode ini digunakan dua rumus yaitu: Menggunakan rumus produk momen dengan angka kasar: R xy = − 2 − 2 } 2 − 2 } Keterangan: R xy = Koefisien korelasi antara variabel XY X = Skor butir soal ganjil Y = Skor butir soal genap N = Jumlah responden Menurut Purwanto 2014: 164 bahwa R xy merupakan hasil korelasi skor belahan awal dan akhir. Angka korelasi yang diperoleh merupakan korelasi antar setengah instrumen, karena skor diperoleh dari hasil pembelahan butir menjadi dua bagian. Koefisien reliabilitas merupakan koefisien reliabilitas penuh, sehingga koefisien reliabilitas yang telah didapat menggunakan langkah pertama, harus diubah menjadi koefisien reliabilitas penuh R xy Purwanto, 2016: 164. Berikut ini rumus untuk mengubahnya menggunakan rumus Sperman Brown seperti di bawah ini: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 11 = 2 1 2 1 2 1 + 1 2 1 2 Keterangan: 11 = Koefisien reliabilitas penuh instrumen 1 2 1 2 = Koefisien reliabilitas setengah instrumen Penentuan dari koefisien reliabilitas pada penelitian ini dengan menggunakan olah data pada program aplikasi TAP Test Analysis Program. Peneliti menggunakan reliabilitas metode Flanagan. Menurut Purwanto 2014: 165 metode ini merupakan salah satu metode penentuan reliabilitas dengan membagi data menjadi dua belahan yaitu ganjil dan genap. Berdasarkan pernyataan tersebut peneliti menggunakan metode belah dua ganjil genap, karena skor yang diperoleh antara belahan pertama dan kedua dimungkinkan tidak jauh berbeda, hal ini disebabkan oleh tingkat kesukaran yang relatif sama antara belahan pertama dan kedua. Berikut ini adalah kriteria rentang skor reliabilitas menurut Sutrisno dalam Ratnawulan dan Rusdiana, 2015: 175: Tabel 3.6 Kategori Tingkat Reliabilitas Tes Nilai r Kategori 0,80 – 1,00 Sangat Tinggi 0,60 – 0,79 Tinggi 0,40 – 0,59 Cukup 0,20 – 0,39 Rendah 0,00 – 0,19 Sangat Rendah Peneliti menetapkan item yang digunakan yaitu item yang mencapai minimum 0,40 atau dengan kategori Cukup. Berikut ini hasil reliabilitas yang menggunakan teknik program TAP: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Gambar 3.4 hasil reliabilitas pada program TAP 3 Daya Pembeda Menurut Kusaeri 2014: 107 daya pembeda merupakan kemampuan soal membedakan siswa yang pandai dan kurang pandai. Berikut ini adalah cara menghitung daya pembeda menurut Kusaeri 2014: 108 : = − 1 2 Keterangan: DP = Daya Pembeda BA = Jumlah jawaban benar pada kelompok atas BB = Jumlah jawaban benar pada kelompok bawah N = Jumlah siswa yang mengerjakan tes Klasifikasi daya beda menurut Arikunto 2012: 232 yang dipakai oleh peneliti adalah sebagai berikut: Tabel 3.7 Klasifikasi Daya Beda Rentang Nilai Kategori 0,00 – 0,20 Jelek 0,21 – 0,40 Cukup 0,41 – 0,70 Baik 0,71 – 1,00 Baik Sekali Peneliti menetapkan item yang digunakan yaitu item yang mencapai minimum 0,41 atau dengan kategori Baik. Berikut ini hasil daya beda yang menggunakan teknik program TAP: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Gambar 3.5 hasil daya beda pada program TAP 4 Tingkat Kesukaran Soal dapat dikatakan baik jika tidak terlalu mudah dan tidak terlalu sulit. Soal yang terlalu mudah tidak merangsang siswa untuk berusaha semaksimal mungkin untuk memecahkannya. Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut indeks kesukaran difficulty index. Besarnya indeks kesukaran antara 0,00 – 1,0. Indeks kesukaran ini menunjukkan taraf kesukaran soal. Menurut Arikunto 2012: 223 Soal dengan indeks kesukaran 0,0 menunjukkan bahwa soal sukar, sebaliknya indeks 1,0 menunjukkan bahwa soal terlalu mudah. Kusaeri 2014: 106 menjelaskan bahwa cara berhitung tingkat kesukaran untuk soal pilihan ganda dengan menggunakan rumus sebagai berikut: Tingkat kesukaran = ℎ ℎ Untuk mengetahui tingkat kesukaran soal peneliti menggunakan aplikasi TAP. Setelah peneliti mengetahui tingkat kesukaran, soal yang valid dikategorikan dalam tiga kelompok yaitu mudah, sedang, dan sukar. Hal ini diperkuat oleh Ratnawulan dan Rusdiana 2015: 163 yang berpendapat bahwa tingkat kesukaran pada umumnya dinyatakan dalam suatu bentuk proporsi yang besarnya berkisar 0,00 – 1,00. Semakin besar indeks tingkat kesukaran berarti semakin mudah soal tersebut. Berikut indeks tingkat kesukaran Ratnawulan dan Rusdiana, 2015: 164: Tabel 3.8 Indeks Tingkat Kesukaran Indeks tingkat kesukaran Kategori 0,00 – 0,30 Soal tergolong sukar 0,31 – 0,70 Soal tergolong sedang 0,71 – 1,00 Soal tergolong mudah Tingkat kesukaran yang baik pada suatu tes adalah 25 “mudah”, 50 “sedang” dan 25 “sukar” Widoyoko 2014: 136. Oleh karena itu, tingkat kesukaran pada tes hasil belajar yang dibuat peneliti ini diharapkan sesuai kurva normal, yaitu 25 “mudah”, 50 “sedang” dan 25 “sukar”. Berikut ini hasil validitas yang menggunakan teknik program TAP: Gambar 3.6 hasil tingkat kesukaran pada program TAP 5 Pengecoh Pengecoh dihadirkan dengan tujuan menyesatkan siswa sehingga tidak memilih jawaban yang benar melainkan memilih jawaban yang salah. Pengecoh dapat dikatakan berfungsi baik apabila paling sedikit dipilih oleh 5 peserta tes dan lebih banyak dipilih oleh kelompok siswa yang kurang pandai Kusaeri, 2014: 109. Sedangkan Arikunto 2012: 234 menjelaskan bahwa pengecoh jawaban akan berfungsi baik jika dipilih 5 atau sebanyak ≥ 0,05. Sedangkan menurut Surapranata 2009: 43 apabila pengecoh dipilih merata dapat dikatakan sangat baik. Namun, jika pengecoh itu dipilih lebih banyak oleh kelompok atas dibanding bawah maka pengecoh itu menyesatkan. Berdasarkan teori di atas, peneliti menyimpulkan bahwa pengecoh dikatakan berfungsi baik apabila pilihan jawaban paling sedikit dipilih oleh 5 peserta tes dan lebih banyak dipilih oleh kelompok siswa yang kurang pandai. Berikut ini hasil validitas yang menggunakan teknik program TAP: Gambar 3.7 hasil pengecoh pada program TAP PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 55

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

A. Hasil Penelitian

Penelitian ini berisi tentang hasil dari langkah-langkah pengembangan tes hasil belajar dan kualitas tes yang telah dilakukan.

1. Langkah-langkah Penelitian dan Pengembangan

Pengembangan tes hasil belajar ini berdasarkan kompetensi dasar melakukan perkalian pembagian yang hasilnya bilangan tiga angka dan melakukan pengerjaan hitung campuran untuk siswa Sekolah Dasar kelas III. Langkah-langkah pengembangan dijabarkan sebagai berikut:

a. Potensi dan Masalah

Peneliti menemukan masalah melalui wawancara kepada guru kelas III SD Jetis Bantul pada tanggal 5 Juni 2016. Hasil wawancara peneliti mendapat potensi untuk mengembangkan tes hasil belajar matematika. Wawancara yang dilakukan peneliti pada guru terkait dengan tes hasil belajar yang dibuat guru. Guru kelas hanya sekedar membuat soal selanjutnya diberikan kepada siswa tanpa mengetahui kualitas dan menganalisisnya seperti validitas, reliabilitas, dan analisis butir soal. Guru juga jarang membuat kisi- kisi terlebih dahulu sebelum membuat soal. Hasil dari wawancara, peneliti juga mendapati informasi bahwa guru kelas yang memberikan soal terkadang hanya mengambil soal dari LKS yang sudah disediakan dari sekolah. Selain wawancara, peneliti juga