PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL.
Dwi Putri Musdansi, 2014
Dwi Putri Musdansi ABSTRAK
Penelitian ini bertujuan untuk mengetahui perbandingan teknik penskoran number
right score dan reward score, number right score dan punishment score, serta
perbandingan ukuran sampel 30 dan 40 terhadap reliabilitas tes hasil belajar Matematika. Instrumen yang digunakan adalah tes pilihan ganda SMA. Teknik pengambilan sampel adalah Cluster Random sampling. Desain penelitian ini menggunakan desain perbandingan kelompok statis. Analisis menggunakan uji-t. Hasil penelitian adalah (1) Ada perbedaan significant reliabilitas tes pilihan ganda hasil belajar Matematika antara teknik penskoran number-right score dengan
reward score. (2) Ada perbedaan significant reliabilitas tes pilihan ganda hasil
belajar Matematika antara teknik penskoran number-right score dengan
punishment score. (3) Tidak ada perbedaan reliabilitas tes pilihan ganda hasil
belajar Matematika kelompok reward dengan ukuran sampel 30 dan 40. (4) Tidak ada perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika kelompok punishment dengan ukuran sampel 30 dan 40
(2)
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
The Comparison Reliability Mathematics Achievement Test Of High School Based On Scoring Technique and Sample Size
Dwi Putri Musdansi Abstract
The purpose of this research was to know the comparison of the scoring techniques number right score and reward score, number right score and punishment, than sample size 30 dan 40 on reliability of the mathematics achievement test. The instrument was used multiple choice form test for High School. Sampling teqniques was cluster random sampling. This research used a static group comparison design. Analyze by using t-test. The research result were (1) there was a the difference between scoring techniques number right score and reward score on reliability of multiple-choice on Mathematics achievement tests, (2) there was a the difference between scoring techniques number right score and punishment score on reliability of multiple-choice on Mathematics achievement tests, (3) for the group of reward score, there was not the difference on reliability of multiple-choice on Mathematics achievement tests between sample size 30 and 40, (4) for the group of punishment score, there was not the difference on reliability of multiple-choice on Mathematics achievement tests between sample size 30 and 40.
Key Word: Scoring Technique, Sample Size, Reliability
(3)
Dwi Putri Musdansi, 2014
BAB I PENDAHULUAN
A. LATAR BELAKANG PENELITIAN
Tujuan belajar adalah untuk mengadakan perubahan didalam diri seperti mengubah kebiasaan dari yang buruk menjadi baik, mengubah sikap dari yang negatif menjadi yang positif (Dalyono, 2010:49). Dengan belajar seseorang dapat menambah pengetahuan dalam berbagai bidang ilmu, dapat berfikir kritis, kreatif dan lain sebagainya. Belajar memiliki tiga prinsip, yaitu pertama, prinsip belajar sebagai perubahan perilaku. Kedua, belajar sebagai proses. Ketiga, belajar sebagai bentuk pengalaman (Suprijono, 2009:4)
Dalam pemahaman umum, belajar merupakan proses untuk mendapatkan ilmu pengetahuan yang biasanya didapat melalui pendidikan formal yaitu sekolah. Dalam lingkungan sekolah, tentu terjadi proses belajar mengajar yang tidak lepas dari peran gurunya. Pada hakikatnya, guru dianggap komponen paling penting untuk menentukan keberhasilan peserta didik, karena ditangan gurulah kurikulum, sumber belajar, sarana dan prasarana, dan iklim pembelajaran dapat menjadi berarti bagi kehidupan peserta didik.
Karena guru dianggap menjadi unsur paling menentukan keberhasilan peserta didik, maka sudah sewajarnyalah dalam proses pembelajaran guru selalu melakukan berbagai evaluasi, pengukuran, serta penilaian sebagai umpan balik dalam upaya memperbaiki proses belajar mengajar, mengukur sejauhmana keberhasilan siswa, maupun sebagai informasi yang berharga dalam mengambil keputusan.
Tentunya informasi tersebut bisa didapat dengan melakukan prosedur pengukuran, karena hanya dengan melakukan pengukuran dapat dikuantifikasikan secara benar, yaitu melalui pengamatan indikator-indikatornya yang operasional. Keakuratan, kecermatan serta keobjektifan informasi tentu hanya akan diperoleh dengan pengukuran yang akurat, cermat dan objketif pula. Oleh karena itu, untuk mendapatkan semua informasi hasil ukur yang tidak menyesatkan, tentu
(4)
2
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
mebutuhkan alat ukur yang berkualitas tinggi sehingga informasi yang diperoleh dapat dipercaya.
Apabila alat ukur yang dibuat memberikan informasi yang tidak akurat digunakan dalam pengambilan keputusan, maka dapat dipastikan kesimpulan atau keputusan tersebut pastilah juga merupakan keputusan yang tidak tepat. Keputusan yang tidak tepat memang tidak langsung dapat dirasakan akibatnya, namun dapat menimbulkan hal buruk yang tidak dikehendaki. Sebagai contoh seseorang dapat ditolak oleh perguruan tinggi berdasarkan tes masuk yang diselenggarakan, padahal mahasiswa tersebut sangat potensial. Dari hal tersebut terlihat bahwa dengan menggunakan tes yang tidak mampu menghasilkan data yang reliabel dan valid, bukan saja calon mahasiswa yang bersangkutan yang dirugikan tetapi juga Universitas yang menolak boleh jadi kehilangan mahasiswa yang sangat potensial. Contoh tersebut memberi pelajaran bahwa betapa besar dampak yang ditimbulkan jika instrumen yang digunakan tidak reliabel dan valid jika digunakan dalam mengambil keputusan.
Oleh karenanya, para ahli psikometrika telah menetapkan beberapa kriteria penting bagi setiap alat ukur psikologi untuk dapat dinyatakan sebagai alat ukur yang baik, yaitu mampu menghasilkan data dan memberikan informasi yang akurat. “Kriteria yang dimaksud adalah valid, reliabel, objektif, standar, ekonomis dan praktis” (Azwar, 2012:2). Naga (2013) mengatakan alat ukur yang baik memberikan hasil yang konstan bila digunakan berulang-ulang, asalkan kemampuan yang diukur tidak berubah. Hal tersebut berkaitan dengan reliabilitas tes tersebut. Makin tinggi reliabilitasnya maka akan tinggi pula tingkat kepercayaan skor amatannya. Skor amatan akan mendekati skor tulennya jika komponen keliru dalam pengukuran semakin kecil.
Ada beberapa hal yang dapat mempengaruhi reliabilitas tes antara lain perbedaan kondisi individu, perbedaan kondisi tes, variasi pengadministrasian tes, serta kesalahan dan perbedaan pemberian skor (Sax,1980:281 dalam Busnawir). Disisi lain juga perlu dipertimbangkan faktor panjang tes, kecepatan, homogenitas kemampuan siswa, tingkat kesukaran butir yang dapat mempengaruhi reliabilitas tes (Mehren dan Lehman, 1973:115-117 dalam Busnawir). Menurut Harun
(5)
(2007:131) reliabilitas juga dipengaruhi oleh cara penyajian tes, suasana hati, sikap subjek terhadap tes, motivasi dan kondisi subjek, keadaan ruangan pengujian, cara memberikan tes, dan sebagainya. Seperti juga dikemukakan Thorndike dalam Surapranata (2009:87) bahwa salah satu dari enam faktor penyebab terjadinya perbedaan skor (interkonsistensi) adalah faktor yang tidak pernah diperhitungkan seperti menerka dan melihat soal yang dilihat sebelumnya.
Sebagaimana diketahui bahwa untuk menetapkan nilai yang berkaitan dengan kinerja dan hasil karya siswa dilakukan melalui evaluasi. Cara evaluasi yang umum dilakukan oleh pelaku pendidikan adalah dengan menggunakan tes. Tes dianggap sebagai alat ukur yang paling praktis untuk mengetahui kemampuan siswa. Seperti yang dikemukan oleh Anastasi (2007) bahwa tes pada dasarnya adalah alat ukur yang objektif dan dibakukan atas sampel tertentu. Mengutip pendapat Frenderick G. Brown dari buku Azwar: Frenderick (Azwar, 2011:3) mengemukakan bahwa tes adalah “prosedur yang sistematik guna mengukur sampel perilaku seseorang. Tes dapat disusun dalam berbagai bentuk dan tipe sesuai dengan tujuan dan maksud penyusunan tes”.
Bentuk tes yang sampai saat ini paling banyak digunakan dalam dunia pendidikan adalah tes bentuk pilihan ganda. Tes bentuk pilihan ganda banyak digunakan karena memiliki kekuatan tersendiri. Zainul (1993:62-64) mengatakan bahwa pertama, butir soal tipe pilihan ganda dapat dikonstruksi dan digunakan untuk mengukur segala level tujuan intruksional, mulai dari yang sederhana sampai yang paling kompleks. Kedua, karakteristik dari butir pilihan ganda hanya menuntut waktu kerja peserta tes sangat minimal sehingga dapat menggunakan jumlah butir soal relatif banyak yang berimplikasi pada penarikan sampel pokok bahasan yang akan diujikan dapat lebih luas. Ketiga, penskoran hasil kerja peserta dapat dikerjakan secara objektif. Keempat, tipe butir soal dapat dikonstruksi sehingga menuntut kamampuan peserta tes untuk membedakan berbagai tingkatan kebenaran sekaligus. Kelima, jumlah option yang dapat disediakan lebih dari dua.
Keenam, tipe butir soal pilihan ganda memungkinkan dilakukan analisis butir soal
(6)
4
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
mengubah tingkat homogenitas alternatif jawaban. Kedelapan, informasi yang diberikan lebih kaya.
Selain kekuatan-kekuatan tersebut, tes pilihan ganda juga memiliki keterbatasan yaitu sukar dikonstruksi, ada kecenderungan pembuat tes mengkonstruksi butir soal tipe ini hanya mengukur ranah ingatan, atau aspek yang paling rendah yaitu ranah kognitif saja. Selain itu setiap jawaban butir tipe objektif memiliki peluang peserta tes untuk melakukan terkaan atau tebakan. Tingkat terkaan adalah satu per jumlah option dalam butir soal itu. Terkaan pada soal pilihan ganda sebenarnya dikarenakan tidak adanya antisipasi agar pengikut tes tidak melakukan tebakan. Antisipasi ini berkaitan dengan teknik penskoran. Teknik penskoran yang saat ini umum digunakan adalah penskoran menjumlahkan jawaban betul atau disebut juga number right score. Dengan teknik ini, bisa saja soal sukar direspon benar oleh siswa yang tidak memiliki kecukupan pengetahuan, dan dijawab salah oleh yang memiliki kecukupan pengetahuan. Jawaban benar yang diberikan oleh peserta tes yang memiliki kemampuan rendah dan jawaban salah oleh kemampuan tinggi tentu berakibat pada reliabilitas yang dihasilkan. Apalagi dalam pelajaran Matematika yang oleh kebanyakan siswa dijadikan momok tersendiri, sehingga besar kemungkinan siswa untuk melakukan terkaan terhadap tes yang diberikan.
Karena adanya faktor terkaan yang ditimbulkan oleh tes bentuk pilihan ganda terutama dalam pelajaran Matematika, tentu hal tersebut memberikan masalah, yaitu hasil tes yang diperoleh peserta tes tidak menggambarkan kemampuan peserta tes yang sesungguhnya sehingga timbul ketidakpercayaan orang terhadap hasil tersebut. Selain itu juga tidak akan terdeteksi apakah siswa memahami tentang soal yang ada atau tidak. Oleh karenanya, untuk meminimalisir terkaan siswa pada tes pilihan ganda maka dibuatlah teknik penskoran untuk mengurangi tebakan. Teknik penskoran tersebut adalah penskoran pinalti. “ Pemberian skor dengan pinalti (hukuman) dalam tes prestasi dikenal dengan istilah Correction for guessing”(Azwar, 2011 :114). Metoda penskoran dengan pinalti ini diyakini dapat menigkatkan reliabilitas dan validitas tes. Hal ini dikarenakan skor yang terkoreksi sudah memiliki tingkat estimasi
(7)
yang lebih baik sebab meliputi pengukuran karakteristik adanya terkaan (Croker dan Algina: 401). Selain peskoran dengan hukuman, upaya lain untuk meningkatkan reliabilitas dengan mengurangi efek terkaan adalah adanya tambahan nilai terhadap butir soal yang diragukan dengan cara mengosongkan jawaban tersebut, dikenal dengan reward score. Kedua teknik Correction for
guessing tersebut belum atau tidak pernah digunakan untuk oleh para guru
disekolah sebagai antisipasi agar siswa tidak melakukan tebakan. Karena guru belum tahu persis besar pengurangannya maupun kebermanfaatan mengenai penggunaan teknik ini.
Selain itu, mengutip pendapat Nikto (1996:72-73) dalam Busnawir (2006:4) mengatakan bahwa “hal yang perlu diperhatikan dalam estimasi kestabilan koefisien reliabilitas adalah ukuran sampel, karena indek reliabilitas dihitung berdasarkan sampel responden sehingga akan berfluktuasi berdasarkan besar sampel yang ditarik dari suatu populasi”. Namun seberapa besar perbedaan fluktuasi itu belum dapat ditentukan secara pasti. Azwar menyebutkan bahwa semakin heterogen suatu kelompok maka reliabilitas yang dihasilkan semakin tinggi. Sebaliknya, semakin homogen suatu kelompok maka semakin kecil reliabilitasnya. Heterogenitas ataupun homogenitas kelompok diperlihatkan oleh besar kecilnya varians distribusi skor subjek pada variabel yang diungkap oleh tes yang bersangkutan.
Dari uraian diatas dikemukakan bahwa jika menulis tes dalam bentuk tes pilihan ganda maka akan berpeluang untuk melakukan tebakan. Ada atau tidaknya tebakan tergantung pada intervensi yang diberikan pada tes, yaitu berupa petunjuk soal pada jenis teknik penskoran. Disisi lain reliabilitas juga dipengaruhi oleh ukuran sampel yang ditarik dari populasi, karena reliabilitas dihitung berdasarkan ukuran responden. Artinya reliabilitas akan berfluktuasi sesuai dengan jumlah sampel yang ditarik. Hal itu disebabkan karena adanya perbedaan sebaran skor yang menyebabkan jika semakin besar ukuran sampel maka akan diperoleh variasi skor yang lebih beragam daripada ukuran sampel yang kecil. Oleh sebab itu melalui penelitian ini, peneliti ingin mengkaji lebih jauh mengenai bagaimanakah
(8)
6
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
koefisien reliabilitas tes hasil belajar yang dihasilkan oleh teknik penskoran dan ukuran sampel.
B. IDENTIFIKASI MASALAH
Berdasarkan latar belakang masalah diatas, maka diperoleh masalah yang diidentifikasi sebagai berikut:
1. Tes bentuk pilihan ganda memberikan peluang besar kepada peserta tes untuk melakukan penebakan.
2. Bentuk tes pilihan ganda yang dihitung reliabilitasnya dapat berupa hasil belajar Matematika, Bahasa Indonesia, Sejarah, Bahasa inggris dan lain sebagainya.
3. Penebakan berpengaruh terhadap reliabilitas
4. Reliabilitas dipengaruhi oleh berbagai faktor diantaranya ukuran sampel, teknik penskoran, kondisi subjek, kondisi ruangan, panjang tes dan lain sebagainya.
5. Teknik penskoran banyak jenisnya, diantaranya number right score, reward
score, punishment score, pembobotan nominal, confiden-weight, dan
sebagainya.
C. PEMBATASAN MASALAH
Agar penelitian ini lebih efektif, efisien, terarah dan dapat dikaji lebih mendalam, maka diperlukan pembatasan masalah. Dalam penelitian ini, peneliti akan fokus pada reliabilitas tes pilihan ganda hasil belajar Matematika serta dua faktor yang diduga mempengaruhi reliabilitas yaitu:
1. Teknik penskoran yang terdiri dari number-right score, reward score, dan
punishment score
2. Ukuran sampel yang dibatasi dengan ukuran sampel 30 dan 40.
D. RUMUSAN MASALAH
Berdasarkan identifikasi dan pembatasan masalah diatas maka dirumuskan permasalahan sebagai berikut:
(9)
1. Apakah ada perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika antara teknik penskoran number-right score dengan reward score?
2. Apakah ada perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika antara teknik penskoran number-right score dengan punishment score?
3. Apakah ada perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika kelompok reward dengan ukuran sampel 30 dan 40?
4. Apakah ada perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika kelompok punishment dengan ukuran sampel 30 dan 40?
E. TUJUAN PENELITIAN
Tujuan penelitian ini adalah untuk menganalisis ada atau tidaknya:
1. Perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika antara teknik penskoran number-right score dan reward score
2. Perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika antara teknik penskoran number-right score dan punishment score
3. Perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika kelompok
reward dengan ukuran sampel 30 dan 40
4. Perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika kelompok
punishment dengan ukuran sampel 30 dan 40
F. MANFAAT PENELITIAN
Dengan adanya penelitian ini maka akan memberikan manfaat:
1. Memberikan informasi tentang koefisien reliabilitas yang akan diperoleh dengan teknik penskoran punishment score dan reward score jika melakukan penebakan.
2. Mendapatkan bukti empirik bahwa ukuran sampel yang berbeda dengan teknik penskoran sama akan memberikan konstribusi yang berbeda pula terhadap kestabilan reliabilitas.
3. Memberikan informasi kepada evaluator pendidikan tentang teknik penskoran yang baik digunakan untuk memperoleh koefisien reliabilitas.
(10)
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
BAB III
METODOLOGI PENELITIAN
A. METODE DAN DESAIN PENELITIAN
Metode
Penelitian ini merupakan perbandingan reliabilitas tes hasil belajar matematika berdasar metode penskoran number-right score dan metode penskoran correction for guessing. Penelitian ini termasuk kedalam penelitian kuantitatif dengan menggunakan metode kuasi-eksperimental (eksperimen semu). Dikatakan kuasi eksperimental karena peneliti tidak melakukan random assigment saat melakukan penskoran menggunakan teknik penskoran number-right score,
punishment score dan reward score.
Desain penelitian
Desain penelitian yang digunakan adalah desain perbandingan kelompok statis (the static group comparison design) yaitu design yang dapat digunakan untuk membandingkan dua atau tiga kelompok penelitian. Satu kelompok kontrol reliabilitas skor hasil tesnya menggunakan metode penskoran number-right score. Sedangkan dua kelompok eksperimen lain reliabilitas skor hasil tesnya menggunakan metode penskoran punishment score dan reward score.
Tabel 3.1 Desain penelitian Teknik Penskoran
Number-right score Correction for guessing
Punishment score reward score
∑
rNR1, rNR2,...., rNR30
rP1, rP2,...., rp30
(11)
B. POPULASI DAN SAMPEL
Populasi dalam penelitian ini terdiri dari dua bagian, yaitu (1) populasi siswa (sebagai subjek), merupakan siswa yang memberikan respon terhadap tes yang diberikan. Populasi ini selanjutnya dinamakan populasi sebagai sumber data. Populasi sebagai sumber data dalam penelitian ini adalah kelas X pada SMA N 7 Bandung, dan SMA N 6 Bandung. Populasi tersebut ditentukan berdasarkan populasi sasaran, artinya populasi yang dibatasi oleh konsep yang menjadi acuan variabel-variabel riset. (2) Populasi skor, yaitu populasi yang digunakan untuk menghitung reliabilitas sebanyak 30 kali, dimana akan dilakukan penarikan berulang-ulang dengan pengembalian (random sampling with replacement) terhadap responden.
Teknik pengambilan sampel responden atau sampel sumber data adalah
cluster random sampling. Jumlah Sampel dalam penelitian ini berjumlah 10
kelas. Terdiri dari 4 kelas SMA Negri 7 Bandung dan 6 kelas SMA N 6 Bandung. Responden berjumlah 316 orang. Setiap kelas kemudian diberi tes dengan
penskoran punishment score atau reward score, sesuai dengan jenis tes yang
mereka peroleh. Dalam penelitian ini, 5 kelas diberi teknik penskoran punishment
score dan 5 kelas diberi teknik penskoran reward score. Namun, dari
masing-masing kelompok tersebut juga akan di nilai dengan teknik penskoran number
right score
Dari hasil respon siswa tersebut diperolelah populasi skor yang dijadikan populasi data. Dari populasi data tersebut kemudian dilakukan penarikan sampel data dengan pengembalian (random sampling with replacement), yaitu cara pengembalian sampel dengan jumlah tertentu, kemudian dikembalikan lagi kepopulasi semula untuk mendapatkan peluang yang sama menjadi sampel pada penarikan sampel berikutnya (Naga, 2008:27).
Teknik random dilakukan dengan bantuan program IBM SPSS Statistics 20, yaitu teknik pencuplikan sederhana. Jumlah pada setiap penarikan sampel yang ditetapkan dalam penelitian ini untuk menghitung koefisien reliabilitas dengan
(12)
38
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
n=30 dan n=40. Penghitungan koefisien reliabilitas itu dilakukan sebanyak 30 kali, sehingga akan diperoleh 30 koefisien reliabilitas pada setiap teknik penskoran. Koefisien reliabilitas itulah yang menjadi sampel penelitian untuk diuji dengan statistik yang ditetapkan.
C. VARIABEL PENELITIAN
Variabel dalam penelitian ini meliputi:
1. Variabel bebas yaitu teknik penskoran, yang terdiri dari teknik penskoran number-right score, punishment score dan reward score. 2. Variabel moderator yaitu ukuran sampel yang terdiri dari sampel dengan
ukuran 30 dan 40
3. Variabel terikat yaitu koefisien reliabilitas konsistensi internal.
D. DEFINISI OPERASIONAL VARIABEL
1. Variabel bebas; (1) Number-right score merupakan teknik penskoran dengan menjumlahkan jawaban benar, dimana jawaban benar diberi skor 1 dan jawaban salah diberi skor 0. (2) penskoran reward score merupakan teknik penskoran dengan memberikan tambahan skor pada jawaban siswa yang dikosongkan sebesar 0,2. (3) punishment score merupakan teknik penskoran dengan memberikan pengurangan skor pada jawaan salah sebesar -0,25 2. Variabel moderator; (1) sampel ukuran 30 merupakan banyaknya responden
yang akan digunakan dalam penghitungan koefisien reliabilitas. (2) sampel ukuran 40 merupakan banyaknya responden yang akan digunakan dalam penghitungan koefisien reliabilitas.
3. Reliabilitas yang dimaksud merupakan reliabilitas kekonsistenan internal, yaitu untuk menguji apakah jawaban yang diberikan subyek menggambarkan keadaan atau kemampuan dirinya sehubungan dengan aspek tertentu, itu konsisten atau tidak. Sehingga berimplikasi pada skor yang dihasilkan mencerminkan kemampuan siswa, sehingga hasil yang diperoleh dapat dipercaya.
(13)
E. ALUR PENELITIAN
Gambar 3.1 Alur Penelitian Keterangan :
r30ment : reliabilitas yang dihitung dengan ukuran sampel 30 pada penskoran punishment r30ward : reliabilitas yang dihitung dengan ukuran sampel 30 pada penskoran reward r40ment : reliabilitas yang dihitung dengan ukuran sampel 40 pada penskoran punishment r40ment : reliabilitas yang dihitung dengan ukuran sampel 40 pada penskoran punishment S30ward : skor hasil penskoran dengan teknik reward dengan 30 sampel
S : skor hasil penskoran dengan teknik punishment 40 sampel.
Membuat Soal matematika
Di ujikan Kelas Uji
Coba
Reliabilitas, Tingkat Kesukaran dan Daya Beda Butir Soal
Didapat: Uji Validitas Butir Soal
Butir Soal Matematika Yang Valid dan Reliabel
Di ujikan di: Kelas
Eksperimen
Teknik Penskoran Reward
r
30ward1r
30ward2 ...r
40ward1r
40ward2 ...r
40ment1r
40ment2 ...Teknik Penskoran Punishment
r
30ment1r
30ment2 ...S30ment S40ment
S30ward S40war
Number Right Score
(14)
40
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
F. INSTRUMEN
Instrumen yang digunakan merupakan instrumen tes hasil belajar Matematika kelas X SMA semester 2 materi Geometri dan Limit Fungsi. Adapun penyusunan instrumen yang dibuat dalam penelitian ini mengikuti langkah penyusunan perangkat tes menurut Crocker dan Algina dalam Susetyo (2011: 66). Adapun langkah-langkah penyusunan perangkat tes tersebut terdiri dari:
1. Identifikasi tujuan utama penggunaan skor tes
2. Identifikasi dimensi yang mewakili perilaku dalam perangkat tes yang dikonstruksi
3. Menyiapkan spesifikasi tes, yang berisi jumlah dan penyebaran butir tes untuk masing-masing dimensi
4. Menyusun draf awal butir-butir tes
5. Melakukan penelaahan terhadap butir tes dan direvisi bila diperlukan
6. Melaksanakan uji coba pendahuluan terhadap butir tes dan direvisi seperlunya.
7. Melakukan pengujian tes dilapangan dengan sampel yang yang representatif dalam jumlah besar
8. Menentukan atau memilih butir tes, jika perlu kurangi butir yang tidak sesuai dengan kriteria dalam penyusunan awal
9. menguji validitas dan reliabilitas untuk menentukan butir-butir tes
10.mengembangkan petunjuk secara administratif tentang; pelaksanaan tes, cara penskoran dan interpretasi skor.
Dalam penelitian ini instrumen disusun seperti yang dijelaskan pada Bab Kajian Teori, dimana disusun berdasarkan kurikulum 2013. Adapun tabel spesifikasi instrumen dapat dilihat pada lampiran A Hal.69.
G. PROSES PENGEMBANGAN INSTRUMEN
Setelah instrumen dibuat sesuai dengan kisi-kisi yang telah ditentukan dan sebelum digunakan untuk pengumpulan data penelitian, terlebih dahulu dilakukan beberapa uji, yaitu uji validitas dan reliabilitas instrumen.
a. Validitas instrumen
Validitas didefinisikan sebagai ukuran seberapa cermat suatu tes melakukan fungsi ukurnya. Tes yang dikatakan valid harus mengukur sesuatu dan melakukannya dengan cermat (Mardapi, 2004). Penekanan definisi tersebut
(15)
terletak pada seberapa cermat suatu alat ukur melakukan fungsi ukurnya, sehingga memberikan hasil ukur sesuai dengan yang hendak diukur.
Validitas instrumen yang dilakukan dalam penelitian ini meliputi: 1) Validitas Isi
Kevalidan isi bertujuan untuk menilai kerelevanan tes dengan materi yang akan diukur atau data yang akan dikumpulkan. Kevalidan isi dilakukan dengan jajmen logis terhadap relevansi butir-butir soal atau pertanyaan yang diajukan untuk mengumpulkan data. Teknik analisis validitas isi yang digunakan adalah validitas isi untuk kecocokan butir demi butir dengan menggunakan persentase butir yang cocok dengan indikator/tujuan. Penghitungan dengan teknik ini didasarkan pada penghitungan besarnya persentase pada pernyataan cocok, yaitu “persentase kecocokan suatu butir dengan tujuan/indikator berdasarkan penilaian guru/dosen atau ahli. Butir tes dinyatakan valid jika kecocokannya dengan indikator mencapai lebih besar dari 50%. Rumus yang digunakan adalah:
∑
Dengan:
f = frekuensi cocok menurut penilai
∑f= jumlah penilai
2) Validitas Butir Soal
Validitas butir soal meliputi validitas daya beda, tingkat kesukaran dan distraktor.
a) Daya Beda
Daya pembeda suatu butir menunjukkan kepada derajat kemampuan butir soal itu membedakan antar subyek yang mampu dan yang tidak mampu. Pada penelitian ini, secara empirik daya beda ditentukan dengan rumus korelasi point biserial. Point biserial pada dasarnya merupakan penghitungan korelasi butir-total untuk data dengan skor dikotomi. Koefisien korelasi antara butir dan skor total merupakan indeks validitas butir dalam arti kesesuaian butir dengan skor total dalam membedakan
(16)
42
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
subjek yang mendapat skor tinggi dan yang mendapat skor rendah. Dengan demikian korelasi butir dengan total menjadi daya beda butir yang juga dikenal sebagai validitas butir. Menurut Thorndike (1982:71) yang dikutip dari buku Susetyo ( 2011, 165), rumus korelasi point biserial adalah :
√
Keterangan :
ρpbis = validitas butir soal
upi = rata-rata skor responden yang menjawab benar uqi = rata-rata responden yang menjawab salah pi = proporsi jawaban benar butir tes tertentu qi = proporsi jawaban salah butir tertentu
Dalam Naga (2008:65) Berikut beberapa pendapat ahli mengenai daya beda butir minimum yang dianggap memadai:
Tabel 3.2 Daya Beda Minimum
Penulis Daya Beda Minimum
Crocker dan Algina (1986: 324) 0,2
Nunnally (1970:202) 0,2
Aiken (1994:65) 0,2
Mehrens and Lehmans (1991:167) 0,2
Henning (1987:53) 0,25
Menurut Naga (2008:65) nilai daya beda minimum dianggap memadai adalah
≥0,2
b) Tingkat kesukaran butir
Derajat kesukaran suatu butir soal adalah proporsi dari subyek yang menjawab benar butir soal itu. Artinya, makin besar proporsinya, makin mudah soal dan makin kecil proporsi makin sulit soal.
Keterangan:
(17)
b : Banyaknya siswa yang menjawab soal itu dengan benar n : Jumlah seluruh siswa peserta tes
(Ali, 2011: 166) Kriteria indeks kesukaran suatu tes menurut Witherington dalam Susetyo (2011:154) adalah sebagai berikut:
Tabel 3.3 Kriteria Indeks Kesukaran
Batasan Kategori
0,00 ≤ P < 0,30 Soal sukar
0,30 ≤ P < 0,70 Soal sedang
0,70 ≤ P ≤ 1,00 Soal mudah
Meskipun tidak selalu benar, pada umumnya P yang berada disekitar 0,5 dianggap yang terbaik. Sebenarnya angka P yang terbaik adalah yang sesuai dengan tujuan tes yang bersangkutan.
c) Distraktor
Analisis distraktor atau pengecoh tujuannya adalah mengetahui kemampuan responden yang sebenarnya dengan memberikan pilihan alternatif yang memungkinkan untuk dipilih terutama responden yang tidak memahami butir tes tersebut (Susetyo, 2011:171). Pengecoh yang tergolong baik adalah pengecoh yang dipilih oleh peserta tes minimum sebesar 5%.
b. Reliabilitas Instrumen
Reliabilitas instrumen merupakan ketepatan alat ukur dalam mengukur atau ketepatan siswa dalam menjawab alat ukur itu. Suatu tes dapat dikatakan memiliki taraf reliabilitas yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Dalam penelitian ini, skor respon siswa berupa skor dikotomi, oleh karenanya uji reliabilitas instrumen menggunakan formula Kuder Richardson yaitu KR20 karena diasumsikan tingkat kesukaran pada item-itemnya tidak
homogen atau varians item-itemnya tidak setara. Hal itu disebabkan tes dikonstruksi dengan tingkat kesukaran yang berbeda. Jika pada akhirnya ternyata
(18)
44
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
tingkat kesukaran item-itemnya homogen, maka formula reliabilitas yang digunakan adalah formula KR-21.
Adapun formula KR-20 adalah sebagai berikut :
ρ ∑ dimana,
P = proporsi menjawab benar q = proporsi menjawab salah k = jumlah butir tes
Σpq = jumlah perkalian jawaban benar dengan salah
ρKR20 = koefisien reliabilitas = varian skor tes N = jumlah responden
H. TEKNIK PENGUMPULAN DATA
Teknik Pengumpulan data pada penelitian ini, yaitu melalui tes tulis hasil belajar Matematika siswa. Tes tulis digunakan karena teknik tersebut dianggap paling tepat dan objektif untuk mengukur hasil belajar Matematika siswa dengan menerapkan teknik penskoran yang berbeda. Adapun prosedur pengumpulannya sebagai berikut:
1. Perangkat tes yang dibuat untuk masing-masing teknik penskoran adalah sama, yang membedakan hanyalah pada instruksi yang diberikan pada petunjuk soal.
2. Pada setiap kelas dikenai teknik penskoran punisment score atau reward
score. Artinya pada setiap kelas akan terdapat kelas yang mengerjakan tes
dengan penskoran punisment score atau reward score.
3. Setiap respon dari masing-masing individu dihitung dengan penskoran
punisment score dan reward score (sesuai dengan jenis soal yang didapatkan
(19)
score. Sehingga setiap individu akan memiliki 2 skor, yaitu diskor dengan Number-right dan reward score atau Number-right dan punisment score
4. Respon siswa yang telah dikenakan teknik penskoran itulah menjadi populasi data.
5. Dari score responden tersebut dilakukan penarikan sampel yang kemudian dihitung reliabilitasnya.
6. Hal yang sama dilakukan sebanyak 30 kali, sehingga diperoleh 30 koefisien reliabilitas pada setiap kelompok.
7. Dari 30 koefisien reliabilitas tersebut kemudian diolah dengan teknik pengolahan data yang ditentukan
Adapun formula yang digunakan untuk menghitung reliabilitas adalah dengan formula Cronbach Alpha, yaitu:
∑
dimana,
ρ = koefesien reliabilitas
∑ = jumlah seluruh variansi butir = variansi sekor responden = jumlah butir yang setara
I. TEKNIK PENGOLAHAN DATA
Teknik pengolahan data dilakukan dua tahap, yaitu uji asumsi analisis dan pengujian hipotesis. Pengujian hipsotesis dilakukan dengan uji-T.
1) Uji asumsi analisis
Uji asumsi dilakukan sebelum dilakukannya pengujian hipotesis. Uji asumsi dilakukan untuk memperoleh (menentukan) peluang yang sahih atas munculnya nilai T. Asumsi yang harus dipenuhi yaitu, independent of score, normalitas distribusi data dan homogenitas variansi populasi.
Pengujian asumsi yang dihitung secara empirik, yaitu uji normalitas dan uji homogenitas. Sedangkan uji independent of score, Furqon (2009) mengatakan kita
(20)
46
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
tidak dapat mendekteksi adanya pelanggaran terhadap asumsi ini dengan melihat data yang diperoleh, kita hanya dapat mengetahui dan mengontrol asumsi ini pada waktu pelaksanaan penelitian (eksperimen) dan pengumpulan data, apakah prilaku (kinerja) subjek yang satu mempengaruhi dan/atau dipengaruhi oleh subjek yang lain, baik dalam kelompok maupun antar kelompok. Oleh karena itu, validitas hasil penelitian yang didasarkan pada analisis data yang melanggar asumsi ini sulit dipertahankan.
a. Uji Normalitas
Uji ini digunakan untuk mengetahui apakah sampel penelitian ini dari populasi yang normal atau tidak. Untuk menguji normalitas ini digunakan metode Shapiro-Wilk sebagai berikut:
1) Hipotesis :
H0 : data berdistribusi normal H1 : data tidak berdistribusi normal 2) Tingkat signifikansi :
0,053) Statistik uji yang digunakan Shapiro-Wilk
Komputasi dilakukan dengan bantuan program SPSS.
4) Kriteria penerimaan atau penolakan H0 berdasarkan P-value, yaitu:
Jika P-value < α, maka H0 ditolak
Jika P-value ≥ α, maka H0 diterima.
Dalam Program SPSS digunakan istilah Significance (yang disingkat Sig.) untuk menyatakan P-value, artinya P-value= sig.
b. Uji Homogenitas
Uji homogenitas digunakan untuk menguji apakah populasi mempunyai variansi yang sama atau tidak. Untuk menguji homogenitas ini digunakan levene statistic pada program SPSS sebagai berikut :
1) Hipotesis :
H0 : = (populasi homogen)
H1 : ≠
2) Tingkat Signifikansi : = 0,05
3) Statistik uji : levene statistic pada uji-t
(21)
Jika P-value < α, maka H0 ditolak
Jika P-value ≥ α, maka H0 diterima.
Dalam Program SPSS digunakan istilah Significance, disingkat Sig. untuk menyatakan P-value, dengan demikian P-value= sig.
2) Pengujian Hipotesis
Uji hipotesis menggunakan uji-t. Uji-t merupakan uji perbedaan dua rata-rata populasi. Uji-t yang dilakukan pada penelitian ini uji-t dependent dan uji-t
independent. Uji-t dependent dimaksudkan untuk membandingkan dua kelompok
yang dibandingkan bersifat dependent (saling mempengaruhi satu sama lain). Sedangkan uji-t independent untuk membandingkan dua kelompok yang dibandingkan bersifat independent (saling bebas) satu sama lain.
Uji hipotesis dilakukan dengan langkah sebagai berikut:
Hipotesis penelitian ke-1
Ada perbedaan reliabilitas antara teknik penskoran Number-right dan
reward score
Hipotesis statistik: Ho : =
H1 : ≠
NR= number right score, R= reward score
Hipotesis penelitian ke-2
Ada perbedaan reliabilitas antara teknik penskoran Number-right dan
punishment score
Hipotesis statistik: Ho : =
H1 : ≠
NR= number right score, P= punishment score Statistik uji:
D
D
(22)
48
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
Hipotesis penelitian ke-3
Ada perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika kelompok
reward dengan ukuran sampel 30 dan 40
Hipotesis statistik: Ho : =
H1 : ≠
R30= kelompok reward dengan ukuran sampel 30, R40= kelompok reward dengan ukuran sampel 40
Hipotesis penelitian ke-4
Ada perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika kelompok
punishment dengan ukuran sampel 30 dan 40
Hipotesis statistik: Ho : =
H1 : ≠
P30= kelompok punishment dengan ukuran sampel 30, P40= kelompok
punishment dengan ukuran sampel 40
Statistik uji :
X Y
√
Komputasi dilakukan dengan bantuan IBM SPSS 20 Kriteria Pengujian
Kriteria penerimaan atau penolakan H0 berdasarkan P-value, yaitu:
Jika P-value < α, maka H0 ditolak
Jika P-value ≥ α, maka H0 diterima
Dalam Program SPSS digunakan istilah Significance, disingkat Sig. untuk menyatakan
(23)
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK BAB V
KESIMPULAN DAN SARAN
A. KESIMPULAN
Berdasarkan hasil dan pembahasan penelitian maka dapat disimpulkan :
1. Ada perbedaan yang significant reliabilitas tes pilihan ganda hasil belajar Matematika antara teknik penskoran number-right score dengan reward
score
2. Ada perbedaan yang significant reliabilitas tes pilihan ganda hasil belajar Matematika antara teknik penskoran number-right score dengan punishment
score
3. Tidak ada perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika kelompok reward dengan ukuran sampel 30 dan 40
4. Tidak ada perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika kelompok punishment dengan ukuran sampel 30 dan 40
B. SARAN
Hasil penelitian ini tentunya diharapkan dapat memberikan kontribusi yang berarti bagi praktisi pendidikan khususnya dan pembaca pada umumnya. Apalagi mengingat saat ini kebanyakkan guru tidak mau menggunakan soal bentuk pilihan ganda dikarenakan dengan soal pilihan ganda siswa akan cenderung memiliki kesempatan bahkan atau keinginan siswa melakukan kecurangan dalam memberikan respon terhadap stimulus (butir soal) yang diberikan oleh guru di sekolah.
Dengan adanya penelitian ini hendaknya dapat dijadikan referensi oleh para guru bahwasanya unsur tebakan dalam soal bentuk pilihan ganda dapat diminimalisir dengan menggunakan teknik penskoran punishment score dan
reward score. Dilihat dari skor-skornya, guru dapat menggunakan teknik
penskoran punishment score pada siswa yang memiliki kemampuan tinggi, karena pada kemampuan tinggi teknik ini akan berjalan efektif, tetapi pada kemampuan sedang ataupun rendah, teknik ini tidak memberikan pengaruh apapun, artinya
(24)
68
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
siswa tetap melakukan tebakan. Sedangkan untuk teknik penskoran reward score, dapat digunakan pada level kemampuan manapun. Selanjutnya, jika ingin memperoleh koefisien reliabilitas yang menggambarkan kemampuan, sebaiknya menggunakan teknik penskoran punishment score, karena merupakan formula yang baik untuk correction for guessing, mengingat jika tidak melakukan penebakan (jawabannya dikosongkan) maka skor akan berbentuk 1 dan 0 saja.
Selain itu, dalam penelitian ini memiliki keterbatasan, yaitu peneliti memperoleh skor number right score dari penskoran reward dan punishment, sehingga belum didapat bukti autentik bahwa dengan number right score akan diperoleh koefisien lebih rendah dari yang lainnya akibat faktor tebakan. Selain itu dalam penelitian ini juga belum membandingkan koefisien reliabilitas antara teknik punishment dan reward, karena jika ingin membandingkan peneliti belum punya bukti bahwa kedua kelompok memiliki kemampuan yang sama. Selanjutnya, untuk uji-t yang digunakan dalam penelitian ini masih memiliki kelemahan jika menggunakan variabel terikat yang sama.
Oleh sebab itu, untuk peneliti selanjutnya hendaknya membandingan ketiga teknik tersebut dengan number right score tidak diberi instruksi, sedangkan
punishment dan reward diberi instruksi sesuai ketentuan. Namun ketika ingin
membandingkan ketiganya dengan cara tersebut, peneliti perlu yakin bahwa pengikut tes harus pada level kemampuan yang sama. Selanjutnya, peneliti juga dapat mengeksplorasi lebih lanjut mengenai ukuran sampel yang digunakan dalam penghitungan reliabilitas, karena dalam penelitian ini belum ditemukan adanya perbedaan reliabilitas ketika sampel ditambah sepertiganya dari jumlah sebelumnya yaitu 30.
(25)
Dwi Putri Musdansi, 2014
DAFTAR PUSTAKA
Ali, Mohammad. 2011. Melakukan Riset Prilaku dan Sosial. Pustaka Cendikia Utama: Bandung
Algina dan Crocker. 1986. Introduction to Clasisical And Modern Test Theory. Anastasi, Anne. 2007 . Tes Psikologi. PT. Indeks : Jakarta
Azwar, Saifuddin. 2012a. Reliabilitas dan Validitas. Pustaka Pelajar : Yogyakarta 2012b. Dasar-dasar Pikometri. Pustaka Pelajar :Yogyakarta.
2011. Tes Prestasi. Pustaka Pelajar :Yogyakarta. Budiyono. 2000. Statistik Dasar untuk Penelitian. FKIP MIPA : UNS
Budi B, Yoga. 2013. Pengaruh jumlah Alternatif Jawaban dan Teknik penskoran
terhadap reliabilitas ter IPA terpad. TESIS UNJ :Tidak diterbitkan.
Busnawir. 2006. Pengaruh Model Penskoran Terhadap Kesetabilan Reliabilitas
Hasil Pengukuran Skala Sikap dengan Mempertimbangkan Varians Usia.
Disertasi UNJ :Tidak Diterbitkan
Dalyono, M. 2010. Psikologi Pendidikan. Rineka Cipta: Jakarta
Furqon. 2009. Statistika Terapan Untuk Penelitian. Alfa Beta : Bandung
Jazuli. Akhmad. 2009. Prosiding Matematika. Sumber
:eprints.uny.ac.id/7025/1/P11-Akhmad%20Jazuli.pdf. didownload 1 Maret 2014, Pukul 20.00 WIB
Kaplan, M Robert dan Saccuzzo, Dennis P. 2012. Pengukuran Psikologi :
Prinsip,penerapan, dan Isu. Salemba Humanika: Jakarta
Kementerian Pendidikan dan Kebudayaan.2013. Matematika kelas X Kurikulum
2013 : Buku Guru. E-Book Kementerian Pendidikan dan Kebudayaan:
Jakarta
Krathwol, David R dan Anderson, Lorin W (editor). 2010. Kerangka Landasan
untuk pengajaran Pembelajaran dan assesment. Pustaka Pelajar:
(26)
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
Lord, Frederic M dan Novick, Melvin R. 1968. Statistical Theories of Mental Test
Score. Massachusett. Addison-Wesley Publishing company, Inc.
Marwanta, dkk (anggota Ikapi). 2008). Mathematics For Senior High School Year
X. Yudhistira
Naga, Dali S. 2013. Teori Sekor Dalam Pengukuran Mental. PT Nagarani Citrayasa: Jakarta
Naga, Dali S. 2008. Probabilitas dan Sekor pada Hipotesis Statistika. UPT Penerbitan Universitas Tarumanegara
Rasyid, Harun, dkk. 2007. Penilaian Hasil Belajar. CV Wacana Prima :Bandung Riska I, Venny. 2009. Perbandingan Daya Beda dan Reliabilitas Tes Pilihan
Ganda Berdasarkan Model Pensekoran. Jakarta :UNJ
Saefudin, Abdul A dan Kusumaningrum, Maya. 2012. Mengoptimalkan
Kemampuan Berfikir Matematika Malalui Pemecahan Masalah Matematika. Prosiding
Santrock, John W. 2003. Andolescence Perkembangan Remaja. Erlangga : Jakarta Sigit Suprijanto, dkk (anggota Ikapi). 2009. Mathematics For Senior High School
Year XI. Yudhistira
Suharsaputra, Uhar. 2012. Metode Penelitian : Kuantitatif, Kualitatif, dan
Tindakan. PT Refika Aditama: Bandung
Sukardi, Dewa Ketut dan Kusmawati, Nila. 2009. Analisis Tes Psikologi Teori
dan Praktik. Rhineka Cipta : Jakarta
Surapranata, Sumarna. 2009. Analisis, Validitas, Reliabilitas, dan Interpretasi
Hasil. PT Remaja Rosdakarya: Bandung.
Suprijono, Agus. 2009. Cooperative Learning: Teori dan Aplikasi Paikem. Pustaka Belajar: Yogyakarta
Susetyo, Budi. 2011. Menyusun Tes Hasil Belajar. CV Cakra: Bandung
Suryabrata, Sumadi. 2002. Pengembangan Alat Ukur Psikologis. Andi: Yogyakarta.
Throndike et al, Robert M. 1991. Measurement and Evaluation In Psychology and
(27)
Dwi Putri Musdansi, 2014
Uyanto, Stanislaus S.2009. Pedoman Analisi data dengan SPSS.Graha Ilmu: Yogyakarta
Venny Riska, Indriyani. (2009). Perbandingan Daya Beda Dan Reliabilitas Tes
Pilihan Ganda Berdasarkan Model Pensekoran. Jakarta: UNJ
Widiatmoko. 2009. Pengaruh Metode Penyekoran Pada Stabilitas Koefisisen
Reliabilitas Sekor Tes Objektif Pilihan Ganda Ditinjau Dari Keragaman Intelegensi Peserta Tes. Disertasi UNJ : Tidak Diterbitkan.
Yuri R, Levita. 2011. Pengaruh Metode Pensekoran dan Risk Talking Level
Terhdap Relibilitas Tes Matematika. Disertasi UNJ : Tidak diterbitkan
Zainul, Asmawi. 1993. Penilaian Hasil Belajar. PAU-PPAI Universitas Terbuka: Jakarta
http://digilib.uinsuka.ac.id/8036/1/EVA%20LATIPAH%20STRATEGIPENGEN
ALAN%20POTENSI%20ANAK.pdf. Didownload 5 Februari 2014, pukul
(1)
48
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
Hipotesis penelitian ke-3
Ada perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika kelompok reward dengan ukuran sampel 30 dan 40
Hipotesis statistik: Ho : = H1 : ≠
R30= kelompok reward dengan ukuran sampel 30, R40= kelompok reward dengan ukuran sampel 40
Hipotesis penelitian ke-4
Ada perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika kelompok punishment dengan ukuran sampel 30 dan 40
Hipotesis statistik: Ho : = H1 : ≠
P30= kelompok punishment dengan ukuran sampel 30, P40= kelompok punishment dengan ukuran sampel 40
Statistik uji :
X Y
√
Komputasi dilakukan dengan bantuan IBM SPSS 20 Kriteria Pengujian
Kriteria penerimaan atau penolakan H0 berdasarkan P-value, yaitu:
Jika P-value < α, maka H0 ditolak
Jika P-value ≥ α, maka H0 diterima
Dalam Program SPSS digunakan istilah Significance, disingkat Sig. untuk menyatakan P-value, dengan demikian P-value= sig
(2)
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
BAB V
KESIMPULAN DAN SARAN A. KESIMPULAN
Berdasarkan hasil dan pembahasan penelitian maka dapat disimpulkan :
1. Ada perbedaan yang significant reliabilitas tes pilihan ganda hasil belajar Matematika antara teknik penskoran number-right score dengan reward score
2. Ada perbedaan yang significant reliabilitas tes pilihan ganda hasil belajar Matematika antara teknik penskoran number-right score dengan punishment score
3. Tidak ada perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika kelompok reward dengan ukuran sampel 30 dan 40
4. Tidak ada perbedaan reliabilitas tes pilihan ganda hasil belajar Matematika kelompok punishment dengan ukuran sampel 30 dan 40
B. SARAN
Hasil penelitian ini tentunya diharapkan dapat memberikan kontribusi yang berarti bagi praktisi pendidikan khususnya dan pembaca pada umumnya. Apalagi mengingat saat ini kebanyakkan guru tidak mau menggunakan soal bentuk pilihan ganda dikarenakan dengan soal pilihan ganda siswa akan cenderung memiliki kesempatan bahkan atau keinginan siswa melakukan kecurangan dalam memberikan respon terhadap stimulus (butir soal) yang diberikan oleh guru di sekolah.
Dengan adanya penelitian ini hendaknya dapat dijadikan referensi oleh para guru bahwasanya unsur tebakan dalam soal bentuk pilihan ganda dapat diminimalisir dengan menggunakan teknik penskoran punishment score dan reward score. Dilihat dari skor-skornya, guru dapat menggunakan teknik penskoran punishment score pada siswa yang memiliki kemampuan tinggi, karena pada kemampuan tinggi teknik ini akan berjalan efektif, tetapi pada kemampuan sedang ataupun rendah, teknik ini tidak memberikan pengaruh apapun, artinya
(3)
68
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
siswa tetap melakukan tebakan. Sedangkan untuk teknik penskoran reward score, dapat digunakan pada level kemampuan manapun. Selanjutnya, jika ingin memperoleh koefisien reliabilitas yang menggambarkan kemampuan, sebaiknya menggunakan teknik penskoran punishment score, karena merupakan formula yang baik untuk correction for guessing, mengingat jika tidak melakukan penebakan (jawabannya dikosongkan) maka skor akan berbentuk 1 dan 0 saja.
Selain itu, dalam penelitian ini memiliki keterbatasan, yaitu peneliti memperoleh skor number right score dari penskoran reward dan punishment, sehingga belum didapat bukti autentik bahwa dengan number right score akan diperoleh koefisien lebih rendah dari yang lainnya akibat faktor tebakan. Selain itu dalam penelitian ini juga belum membandingkan koefisien reliabilitas antara teknik punishment dan reward, karena jika ingin membandingkan peneliti belum punya bukti bahwa kedua kelompok memiliki kemampuan yang sama. Selanjutnya, untuk uji-t yang digunakan dalam penelitian ini masih memiliki kelemahan jika menggunakan variabel terikat yang sama.
Oleh sebab itu, untuk peneliti selanjutnya hendaknya membandingan ketiga teknik tersebut dengan number right score tidak diberi instruksi, sedangkan punishment dan reward diberi instruksi sesuai ketentuan. Namun ketika ingin membandingkan ketiganya dengan cara tersebut, peneliti perlu yakin bahwa pengikut tes harus pada level kemampuan yang sama. Selanjutnya, peneliti juga dapat mengeksplorasi lebih lanjut mengenai ukuran sampel yang digunakan dalam penghitungan reliabilitas, karena dalam penelitian ini belum ditemukan adanya perbedaan reliabilitas ketika sampel ditambah sepertiganya dari jumlah sebelumnya yaitu 30.
(4)
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
DAFTAR PUSTAKA
Ali, Mohammad. 2011. Melakukan Riset Prilaku dan Sosial. Pustaka Cendikia Utama: Bandung
Algina dan Crocker. 1986. Introduction to Clasisical And Modern Test Theory. Anastasi, Anne. 2007 . Tes Psikologi. PT. Indeks : Jakarta
Azwar, Saifuddin. 2012a. Reliabilitas dan Validitas. Pustaka Pelajar : Yogyakarta 2012b. Dasar-dasar Pikometri. Pustaka Pelajar :Yogyakarta.
2011. Tes Prestasi. Pustaka Pelajar :Yogyakarta. Budiyono. 2000. Statistik Dasar untuk Penelitian. FKIP MIPA : UNS
Budi B, Yoga. 2013. Pengaruh jumlah Alternatif Jawaban dan Teknik penskoran terhadap reliabilitas ter IPA terpad. TESIS UNJ :Tidak diterbitkan.
Busnawir. 2006. Pengaruh Model Penskoran Terhadap Kesetabilan Reliabilitas Hasil Pengukuran Skala Sikap dengan Mempertimbangkan Varians Usia. Disertasi UNJ :Tidak Diterbitkan
Dalyono, M. 2010. Psikologi Pendidikan. Rineka Cipta: Jakarta
Furqon. 2009. Statistika Terapan Untuk Penelitian. Alfa Beta : Bandung
Jazuli. Akhmad. 2009. Prosiding Matematika. Sumber :eprints.uny.ac.id/7025/1/P11-Akhmad%20Jazuli.pdf. didownload 1 Maret 2014, Pukul 20.00 WIB
Kaplan, M Robert dan Saccuzzo, Dennis P. 2012. Pengukuran Psikologi : Prinsip,penerapan, dan Isu. Salemba Humanika: Jakarta
Kementerian Pendidikan dan Kebudayaan.2013. Matematika kelas X Kurikulum 2013 : Buku Guru. E-Book Kementerian Pendidikan dan Kebudayaan: Jakarta
Krathwol, David R dan Anderson, Lorin W (editor). 2010. Kerangka Landasan untuk pengajaran Pembelajaran dan assesment. Pustaka Pelajar: Yogyakarta
(5)
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
Lord, Frederic M dan Novick, Melvin R. 1968. Statistical Theories of Mental Test Score. Massachusett. Addison-Wesley Publishing company, Inc.
Marwanta, dkk (anggota Ikapi). 2008). Mathematics For Senior High School Year X. Yudhistira
Naga, Dali S. 2013. Teori Sekor Dalam Pengukuran Mental. PT Nagarani Citrayasa: Jakarta
Naga, Dali S. 2008. Probabilitas dan Sekor pada Hipotesis Statistika. UPT Penerbitan Universitas Tarumanegara
Rasyid, Harun, dkk. 2007. Penilaian Hasil Belajar. CV Wacana Prima :Bandung Riska I, Venny. 2009. Perbandingan Daya Beda dan Reliabilitas Tes Pilihan
Ganda Berdasarkan Model Pensekoran. Jakarta :UNJ
Saefudin, Abdul A dan Kusumaningrum, Maya. 2012. Mengoptimalkan Kemampuan Berfikir Matematika Malalui Pemecahan Masalah Matematika. Prosiding
Santrock, John W. 2003. Andolescence Perkembangan Remaja. Erlangga : Jakarta Sigit Suprijanto, dkk (anggota Ikapi). 2009. Mathematics For Senior High School
Year XI. Yudhistira
Suharsaputra, Uhar. 2012. Metode Penelitian : Kuantitatif, Kualitatif, dan Tindakan. PT Refika Aditama: Bandung
Sukardi, Dewa Ketut dan Kusmawati, Nila. 2009. Analisis Tes Psikologi Teori dan Praktik. Rhineka Cipta : Jakarta
Surapranata, Sumarna. 2009. Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil. PT Remaja Rosdakarya: Bandung.
Suprijono, Agus. 2009. Cooperative Learning: Teori dan Aplikasi Paikem. Pustaka Belajar: Yogyakarta
Susetyo, Budi. 2011. Menyusun Tes Hasil Belajar. CV Cakra: Bandung
Suryabrata, Sumadi. 2002. Pengembangan Alat Ukur Psikologis. Andi: Yogyakarta.
Throndike et al, Robert M. 1991. Measurement and Evaluation In Psychology and Education. New York Macmilan Publishing Company
(6)
Dwi Putri Musdansi, 2014
PERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA SMA BERDASARKAN TEKNIK PENSKORAN DAN UKURAN SAMPEL
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
Uyanto, Stanislaus S.2009. Pedoman Analisi data dengan SPSS.Graha Ilmu: Yogyakarta
Venny Riska, Indriyani. (2009). Perbandingan Daya Beda Dan Reliabilitas Tes Pilihan Ganda Berdasarkan Model Pensekoran. Jakarta: UNJ
Widiatmoko. 2009. Pengaruh Metode Penyekoran Pada Stabilitas Koefisisen Reliabilitas Sekor Tes Objektif Pilihan Ganda Ditinjau Dari Keragaman Intelegensi Peserta Tes. Disertasi UNJ : Tidak Diterbitkan.
Yuri R, Levita. 2011. Pengaruh Metode Pensekoran dan Risk Talking Level Terhdap Relibilitas Tes Matematika. Disertasi UNJ : Tidak diterbitkan Zainul, Asmawi. 1993. Penilaian Hasil Belajar. PAU-PPAI Universitas Terbuka:
Jakarta
http://digilib.uinsuka.ac.id/8036/1/EVA%20LATIPAH%20STRATEGIPENGEN
ALAN%20POTENSI%20ANAK.pdf. Didownload 5 Februari 2014, pukul