Tahap Pelaksanaan Penilaian TINJAUAN PUSTAKA

penting untuk diperhatikan dari suatu soal. Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu kegunaan bagi guru dan kegunaan bagi pengujian dan pengajar- an Nitko, 1996. Kegunaannya bagi guru adalah: 1 sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi masukan kepada peserta didik tentang hasil belajar mereka, 2 memperoleh informasi tentang penekanan kurikulum atau mencurigai terhadap butir soal yang bias. Adapun kegunaannya bagi pengu- jian dan pengajaran adalah: 1 pengenalan konsep yang diperlukan untuk diajar- kan ulang, 2 tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum se- kolah, 3 memberi masukan kepada peserta didik, 4 tanda-tanda kemungkinan adanya butir soal yang bias, 5 merakit tes yang memiliki ketepatan data soal. Tingkat kesukaran secara umum didapat dari adanya proporsi jawaban benar, atau jumlah peserta tes yang menjawab benar pada butir soal yang dianalisis diban- dingkan jumlah seluruh peserta tes. Menurut Arikunto 2013, soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang peserta didik untuk mempertinggi usaha memecahkan- nya. Sebaliknya soal yang terlalu sukar akan menyebabkan peserta didik menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jang- kauan. Berdasarkan hal tersebut dapat dikatakan bahwa soal-soal yang dianggap baik adalah soal-soal sedang, yaitu soal-soal yang mempunyai indeks kesukaran 0,30 sampai dengan 0,70 Arikunto, 2013. Aspek selanjutnya adalah aspek validitas soal. Validitas merupakan ukuran yang menunjukkan tingkat-tingkat kevalidan atau kesahihan sesuatu instrumen. Suatu instrumen dinyatakan valid apabila mampu mengukur apa yang diinginkan Arikunto, 2013. Validitas sebuah tes selalu dibedakan menjadi dua macam yaitu validitas logis dan validitas empiris. Validitas logis sama halnya dengan analisis kualitatif dari suatu soal, yaitu meninjau berfungsi tidaknya suatu soal berdasar- kan kriteria yang telah ditentukan yaitu kaitannya dengan kriteria materi, konstruk dan bahasa. Analisis kuantitatif suatu soal biasa disebut validitas empiris empi- rical validity yang dilakukan untuk melihat berfungsi tidaknya suatu soal, setelah soal diujicobakan ke sampel yang representatif Arikunto, 2013. Aspek selanjutnya adalah reliabilitas soal. Menurut Sudjana 2004, reliabilitas alat penilaian adalah ketetapan atau keajegan alat tersebut dalam menilai apa yang dinilainya. Artinya, kapanpun alat penilaian tersebut digunakan akan memberikan hasil yang relatif sama. Sedangkan menurut Arifin 2011, suatu tes dikatakan re- liabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda. Reliabilitas merupakan salah satu ciri dari suatu instrumen asesmen dimana soal yang digunakan adalah sebagai alat ukur yang mengukur skor peserta tes yang benar-benar menggambarkan kemampuan mereka Mulyasa, 2009. Kemudian menurut hasil penelitian Aiken et al Mulyasa, 2009, tingkat kesuka- ran dalam koefisien reliabilitas memegang peranana penting dan paling dominan. Hal ini dapat disebabkan karena menyangkut variasi jumlah soal yang dapat dija- wab benar. Semakin sukar soal-soal dalam instrumen asesmen, maka akan sema- kin besar pula variasi skor yang diperoleh belahan sehingga makin besar pula re- liabilitas tes tersebut. Sehubungan dengan reliabilitas ini, Anderson 2001 menyatakan juga bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini