36 2 Program Bahasa mencakup Bahasa Inggris nilai harus 65, Bahasa
Indonesia nilai harus 60, Sejarah Budaya nilai harus 60, Sosiologi nilai harus 60, semua nilai tersebut ditambah hasil test.
3 Rata-rata semester 1dan 2 6,5 Jumlah nilai 52. 4 Hanya boleh ada 1 nilai K pada raport semester 2 untuk mata palajaran
ciri khas Bahasa. SMA Negeri 8 Surakarta, 2009
B. Hasil Penelitian yang Relevan
Berdasarkan penelitian Khida Efti Nely Ifada pada tahun 2009 yang berjudul “Analisis Validitas Dan Reliabilitas Butir Soal Ulangan Akhir Semester
Bidang Studi Kimia Kelas X SMA Negeri 1 Pati Tahun Ajaran 20072008 Terhadap Pencapaian Kompetensi”, dari 35 soal yang diujikan di sekolah RSBI
tersebut hanya 30 soal yang valid, dan memiliki daya beda yang cukup. Sedangkan dari analisis tingkat kesukarannya, soal belum proporsional dan
reliabilitasnya sudah cukup tinggi. Butir soal yang tidak valid tidak dapat digunakan untuk pengukuran hasil belajar.
Chan Yuen Fook and Gurnam Kaur Sidhu dalam penelitiannya pada tahun 2010 yang berjudul “
Authentic Assessment and Pedagogical Strategies in Higher Education
”, menyatakan bahwa: “
Assessment strategies should be closely related to teaching and learning. Assessing authentic performances should become integral parts of the
instructional cycle and feedback provided by the lecturer and peers should be formative in order to help the students assess their strengths and
weaknesses, identifying areas of needed growth and mobilizing current capacity
” Berdasarkan penelitian tersebut dapat diketahui bahwa strategi penilaian
sangat berkaitan dengan pengajaran dan pembelajaran. Menilai harus menjadi bagian dari siklus instruksional dan umpan balik yang diberikan oleh guru
sehingga dapat membantu siswa menilai kemampuan dan kelemahan mereka, mengidentifikasi bakat dan mengembangkannya.
Berdasarkan penelitian Romel A Morales pada tahun 2009 yang berjudul “
Evaluation of Mathematics Achievement Test
” dinyatakan bahwa:
37 “
Based on the test results, Item 9 on the achievement test belong to the easiest items, yet, no students were able to answer it. The item will be
rejected or it will be revised thoroughly and make it the first item in an effort to place an easier item first on the student assessment. The item will
be reworded because the author felt students were overanalyzing the question. The item with the negative item-total correlation item 7 will be
deleted because the item in general was confusing. The test was made to measure the knowledge that was supposedly acquired by a student
regardless of hisher field of specialization
.” Dari penelitiannya dapat disimpulkan bahwa berdasarkan analisis butir soal
ulangan matematika yang diujikan kepada mahasiswa jurusan matematika Universitas Pilipina terdapat item yang mencakup materi mudah namun tidak ada
mahasiswa yang mampu menjawabnya yaitu item no 9. Item tersebut akan ditolak atau ditinjau kembali secara menyeluruh. Item tersebut akan ditata ulang
kalimatnya karena pengarang merasa bahwa item tersebut membingungkan siswa. Item soal dengan korelasi total negatif akan dihapus karena item tersebut akan
sangat membingungkan siswa. Tes tersebut dibuat untuk mengukur pengetahuan siswa sehingga alat ukurnya harus memenuhi syarat.
Penelitian-penelitian tersebut mencoba mengevaluasi soal tes secara kuantitatif. Proses analisis soal menjadi sangat penting untuk menentukan soal
yang baik dan tidak baik karena soal yang baik diperlukan untuk mengukur keadaan sebenarnya dari siswa, sehingga diperlukan suatu penelitian yang
menganalisis soal secara tepat dan cermat. Penelitian ini bertujuan untuk menganalisis butir soal dari berbagai aspek, antara lain dari aspek kualitatif
meliputi aspek bahasa, konstruksi, materi, jenjang kognitif serta dari aspek kuantitatif yang meliputi reliabilitas, daya pembeda, tingkat kesukaran dan
efektifitas kunci jawaban serta efektifitas pengecoh untuk soal bentuk pilihan ganda.
C. Kerangka Berfikir