28 itu memang dapat dipahami, mengingat bahwa di antara ketiga istilah tersebut
saling terkait seingga sulit untuk dibedakan.
a. Pengukuran
Semua kegiatan di dunia ini tidak lepas dari pengukuran. Keberhasilan suatu program dapat diketahui melalui suatu pengukuran.penelitian- penelitian yang
dilakukan dalam semua bidang selalu melibatkan kegiatan pengukuran, baik yang secara kuantitatif maupun kualitatif. Oleh karena itu, pengukuran memegang
peranan penting, baik untuk pengembangan ilmu pengetahuan dan teknologi maupun untuk penyajian informasi bagi pembuat kebijakan Djemari,2012:6.
Pengukuran pada dasarnya merupakan kegiatan penentuan angka bagi suatu objek secara sistematik. Penentuan angka ini merupakan usaha untuk
menggambarkan karakteristik suatu objek. Pengukuran pada dasarnya merupakan kuantifikasi suatu objek atau gejala Djemari,2012:7.
Kusaeri 2012:4 menjelaskan bahwa Pengukuran measurement
merupakan cabang ilmu statistika terapan yang bertujuan untuk membangun dasar- dasar pengembangan tes yang lebih baik sehingga dapat menghasilkan tes
yang berfungsi secara optimal, valid dan reliabel. Menurut Reynolds, et al.2010:3 yang dikutip oleh Kusaeri 2012:4 mendefinisikan pengukuran
sebagai sekumpulan aturan untuk menetapkan suatu bilangan yang mewakili objek, sifat atau karakteristik, atribut atau tingkah laku. Menurut Azwar 2010:3
yang dikutip oleh Kusaeri 2012:4 mendefiniskan pengertian pengukuruan yaitu bahwa pengukuran sebagai suatu prosedur pemberian angka kuantifikasi
terhadap atribut atau variabel sepanjang garis kontinum. Sedangkan menurut Anas Sudijono 1995:4, pengukuran yang dikenal dalam bahasa inggris measurement
dapat diartikan sebagai kegiatan yang dilakukan untuk mengukur sesuatu. Mengukur pada hakikatnya adalah membandingkan sesuatu dengan atau atas
dasar ukuran tertentu. Sehingga oleh Kusaeri 2012:4 disimpulkan secara sederhana bahwa pengukuran dapat dikatakan sebagai suatu prosedur
membandingkan antara atribut yang hendak diukur dengan alat ukurnya.
29 Dari pengertian diatas maka pengukuran memiliki beberapa karakteristik.
Pertama, pengukuran merupakan perbandingan antara atribut yang diukur dengan alat ukurnya. Artinya, apa yang diukur adalah atribut atau dimensi dari sesuatu,
bukan sesuatu itu sendiri. Pengertian ini memberikan makna bahwa benda yang dimensinya diukur merupakan subjek pengukuran, bukan objek pengukuran.
Kedua, hasil pengukuran bersifat kuantitatif atau berupa angka. Suatu proses pengukuran akan dinyatakan selesai apabila hasilnya telah diwujudkan dalam
bentuk angka, disertai oleh satuan ukuran yang sesuai. Ketiga, hasil pengukuran bersifat deskriptif, yaitu bahwa hanya sebatas memberikan angka yang tidak
diinterpretasikan lebih jauh Kusaeri,2012:5. Pengukuran dapat diartikan sebagai suatu alat ukur dalam membandingkan
suatu hasil pembelajaran dalam dunia pendidikan. Usaha untuk mengetahui suatu keadaan tertentu ini menggunakan prosedur tertentu dimana hasilnya dapat
dinyatakan dalam bentuk kuantitatif. Data hasil pengukuran dapat diklasifikasikan menjadi 4 empat peringkat
yaitu: 1
Nominal Perangkat nominal pada dasarnya mengkategorikan hasil pengukuran
dengan menggunakan simbol angka. Namun angka ini tidak menyatakan peringkat tetapi hanya klasifikasi saja.
2 Ordinal
Yaitu data yang menyatakan urutan saja, yang jarak satu unit skala dengan lainnya tidak sama. Data ordinal merupakan urutan dari atas ke bawah atau
dari tertinggi ke terendah. 3
Interval Yaitu data yang tidak memiliki titik nol mutlak, tetapi jarak satu unit ke unit
berikutnya adalah sama. 4
Rasio Yaitu data yang memiliki titik nol mutlak. Data rasio merupakan peringkat
yang paling tinggi. Teknik statistik yang digunakan untuk menganalisis data pada keempat peringkat pengukuran tersebut tidak sama Djemari,2012:8.
30 Hasil pengukuran harus memiliki kesalahan yang sekecil mungkin. Tingkat
konsistensi memberi hasil pengukuran yang konstan bila digunakan berulang- ulang, asalkan kemampuan yang diukur tidak berubah. Kesalahan pengukuran
menurut Djemari 2012:9 dibedakan menjadi dua yaitu ada yang bersifat acak dan ada yang bersifat tematik. Kesalahan acak disebabkan kondisi fisik dan
mental yang diukur dan yang mengukur bervariasi. Kesalahan acak ini juga disebabkan pemilihan materi pengukuran, seperti bahan ajar yang diujikan cukup
banyak, sehingga dipilih yang esensi saja. Meurut Pusat Penilaian Pendidikan Badan Penelitian dan Pengembangan Kementerian Pendidikan Nasional, ada tiga
kriteria yang dapat digunakan dalam memilih materi atau bahan bahan yang diujikan. Pertama, adalah bahan yang esensi, kedua adalah bahan yang selalu
digunakan dalam pelajaran itu, dan ketiga adalah bahan yang memiliki nilai terapan. Dengan mengacu pada ketiga kriteria tersebut, maka dapat diharapkan
hasil pengukuran akan memiliki kesalahan sekecil mungkin. Kesalahan yang sistematik disebabkan oleh alat ukurnya, yang diukur, dan
yang mengukur. Ada pendidik yang cenderung membuat soal tes yang mdah atau sulit, sehingga hasil pengukuran bisa under atau over estimate dari kemampuan
yang sebenarnya. Dalam melakukan pengukuran pendidik bisa membuat kesalahan yang sistematik. Kesalahan ini bisa terjadi saat penskoran, ada pendidik
yang pemurah dan ada yang mahal dalam memberi skor. Bila murah dan mahalnya dalam memberi skor ini berlaku pada semua peserta didik, maka akan
terjadi kesalahan yang sistematik. Tetapi bila berlaku pada peserta didik tertentu maka akan terjadi bias dalam pengukuran.
Menurut Djemari 2012:10 Kesahihan alat ukur dapat dilihat dari konstruk alat ukur, yaitu mengukur seperti yang direncanakan.menurut teor pengukuran,
substansi yang diukur harus satu dimensi. Aspek bahasa, kerapia tulisan tidak diskor bila tujuan pengukuran adalah mengetahui kemampuan peserta didik dalam
bidang studi tertentu. Konstruksi alat ukur dapat ditelaah pada aspek materi, teknik penulisan soal, dan bahasa yang digunakan.
Kesahihan alat ukur bisa dilihat dari kisi- kisi alat ukur. Kisi- kisi ini berisi tentang materi yang diujikan, bentuk soal, tingkat berpikir yang terlibat, bobot
31 soal dan cara penskoran. Kisi- kisi yang baik adalah yang mewakili bahan ajar.
Untuk itu pokok bahasan yang diujikan dipilih berdasarkan kriteria: 1 pokok bahasan yang esensial, 2 memiliki nilai aolikasi, 3 berkelanjutan, dan 4
dibutuhkan untuk mempelajari mata pelajaran lain. Demikian kompleknya masalah pengukuran sehingga dibutuhkan teori
Pengukuran. Saat ini ada dua teori pengukuran menurut Djemari 2012:11 yang digunakan secara luas, yaitu teori klasik dan teori modern.
1 Teori klasik
Teori ini menggunakan asumsi bahwa skor yang diperoleh seseorang dari hasil suatu pengukuran dapat diuraikn menjadi skor yang sebenarnya dan
skor keslalahan. Teori klasik ini memiliki beberapa kelemahan. Kelemahan yang menonjol adalah statistik butir sangat bergantung pada karakteristik
kelompok yang diukur. Sehingga besarnya statistik butir akan bervariasi atau berbeda- beda dari satu kelompok terhadap kelompok yang lain.
Statistik butir sering disebut dengan parameter butir, yaitu tingkat kesulitan dan daya pembeda butir tes.
2 Teori modern
Teori ini disebut juga dengan teori respons butir. Teori ini berusaha untuk mengembangkan suatu analisis yang menghasilkan estimasi kemampuan
seseorang tanpa dipengaruhi alat ukur yang digunakan. Kemampuan peserta didik tidak diukur hanya dengan berdasarkan jumlah butir soal yang dijawab
benar, tetapi berdasarkan pada pola respons dan jumlah butir yang dijawab benar. Demikian juga statistik butir juga diusahakan agar tidak bergantung
pada karakteristik individu yang diukur.
b. Penilaian Assessment