Analisis Butir Soal Ujian Akhir Semester

ISSN : 2089 - 5488

ANALISIS BUTIR SOAL UJIAN AKHIR SEMESTER MATA KULIAH
HIMPUNAN DAN LOGIKA MATEMATIKA
Joko Suratno
FKIP Universitas Khairun
ABSTRAK
Tujuan penelitian ini adalah untuk mengetahui tingkat kesukaran setiap butir soal ujian
semester pada mata kuliah himpunan dan logika matematika, mengetahui daya beda setiap
butir soal ujian semester pada mata kuliah himpunan dan logika matematika, mengetahui
keberfungsian pengecoh setiap butir soal ujian semester pada mata kuliah himpunan dan
logika matematika, mengetahui eror standar pengukuran soal ujian semester pada mata kuliah
himpunan dan logika matematika, mengetahui realibilitas soal ujian semester pada mata
kuliah himpunan dan logika matematika, dan mengetahui validitas soal ujian semester pada
mata kuliah himpunan dan logika matematika. Penelitian ini merupakan penelitian deskriptif
yang dilaksanakan di Fakultas Keguruan dan Ilmu Pendidikan Universitas Khairun. Data
berupa lembar jawaban siswa pada saat ujian akhir semester yang diperoleh melalui tes dan
data dianalisis secara deskriptif. Berdasarkan analisis yang dilakukan diperoleh kesimpulan,
yaitu secara keseluruhan rata-rata tingkat kesukaran butir soal adalah sebesar 0,414, yang
berarti tingkat kesukaran soal ujian tersebut termasuk dalam kategori sedang, rata-rata indeks
daya beda soal ujian adalah sebesar 0,384 dan dapat dikatakan bahwa butir soal dapat diterima

atau layak tetapi mungkin untuk diperbaiki, sebagian distraktor dapat dikatakan proporsional
pada masing-masing distraktor yang ada dan hanya dua butir soal yang distraktornya ada yang
tidak berfungsi sama sekali yaitu butir soal nomor 26 dan 41, Standard Error of Measurement
(SEM) soal ujian yang dianalisis adalah 3,120, nilai Cobach Alpha sebesar 0,787, sehingga
dapat dikatakan bahwa soal ujian yang dianalisis cukup reliabel, dan terdapat 14 (28%) butir
soal yang tidak valid dan 36 (72%) butir soal yang valid.
Kata Kunci: Analisis Butir Soal, Himpunan dan Logika Matematika

PENDAHULUAN
Bahan ujian atau soal yang bermutu dapat membantu mahasiswa meningkatkan kualitas
pembelajaran dan memberikan informasi dengan tepat tentang mahasiswa mana yang belum
atau sudah mencapai kompetensi. Salah satu ciri soal yang bermutu adalah soal itu dapat
membedakan setiap kemampuan mahasiswa. Semakin tinggi kemampuan mahasiswa dalam
memahami materi pembelajaran, semakin tinggi pula peluang menjawab benar soal atau
mencapai kompetensi yang ditetapkan. Makin rendah kemampuan mahasiswa dalam
memahami materi pembelajaran, makin kecil pula peluang menjawab benar soal untuk
mengukur pencapaian kompetensi yang ditetapkan.
Syarat soal yang bermutu adalah harus sahih (valid) dan handal. Sahih maksudnya bahwa
setiap alat ukur hanya mengukur satu dimensi/aspek saja dan handal maksudnya bahwa setiap
alat ukur harus dapat memberikan hasil pengukuran yang tepat, cermat, dan ajeg. Untuk dapat

menghasilkan soal yang sahih dan handal, penulis soal harus merumuskan kisi-kisi dan
menulis soal berdasarkan kaidah penulisan soal yang baik.
Linn dan Gronlund (1995:47) menyatakan bahwa tes yang baik harus memenuhi tiga
karakteristik, yaitu: validitas, reliabilitas, dan usabilitas. Validitas artinya ketepatan
interpretasi hasil prosedur pengukuran, reliabilitas artinya konsistensi hasil pengukuran, dan
usabilitas artinya praktis prosedurnya. Di samping itu, tes yang baik adalah tes yang valid
artinya mengukur apa yang hendak diukur. Nitko (1996:36) menyatakan bahwa validitas
berhubungan dengan interpretasi atau makna dan penggunaan hasil pengukuran mahasiswa.
Prosiding Seminar Pendidikan ke -3
Suratno, J. (2012). Analisis Butir Soal Ujian Akhir Semester Mata Kuliah Himpunan dan Logika Matematika.
Dalam Saprudin (Ed.), Proseding Seminar Nasional Pendidikan ke-3: Vol. 3, No. 3. Mengembangkan Guru Profesional dan Berkarakter
dalam Upaya Mewujudkan Pendidikan yang Berkualitas Menuju Kota Ternate Bahari Berkesan dan Madani (hal. 62-70). Ternate: PGRI Kota Ternate

Page 62

ISSN : 2089 - 5488

Validitas tes merupakan suatu integrasi pertimbangan evaluatif derajat keterangan empiris
yang mendasarkan pemikiran teoritis yang mendukung ketepatan dan kesimpulan berdasarkan
pada skor tes.

Peningkatan validitas dan reliabilitas tes dapat dilakukan dengan analisis butir soal.
Kegunaan analisis butir soal di antaranya adalah: (1) dapat membantu para pengguna tes
dalam evaluasi atas tes yang diterbitkan, (2) sangat relevan bagi penyusunan tes informal dan
lokal seperti kuis, ulangan yang disiapkan dosen untuk mahasiswa di kelas, (3) mendukung
penulisan butir soal yang efektif, (4) secara materi dapat memperbaiki tes di kelas, (5)
meningkatkan validitas soal dan reliabilitas.
Menentukan validitas dan reliabilitas soal merupakan bagian dari analisis kuantitatif
soal. Selain validitas dan reliabilitas terdapat analisis lain dalam analisis kuantitatif soal yaitu
mengetahui tingkat kesukaran setiap butir, daya bedanya, keberfungsian pengecoh, dan eror
standar dalam pengukuran.
Soal pilihan ganda dapat digunakan untuk mengevaluasi tujuan pembelajaran yang lebih
luas dari pada bentuk butir soal pilihan yang lain (Nitko, 2007:151). Namun demikian, soalsoal yang dikembangkan oleh para dosen di Program Studi Pendidikan Matematika
Universitas Khairun belum pernah dianalisis secara kuantitatif, sehingga belum diketahui
apakah soal-soal yang dikembangkan sudah memenuhi kriteria yang diharapkan.
Soal pilihan ganda yang digunakan dalam ujian akhir semester pada mata kuliah
himpunan dan logika matematika pada Program Studi Pendidikan Matematika Universitas
Khairun juga belum pernah dianalisis secara kuantitatif, sehingga belum diketahui apakah
soal yang dikembangkan telah memenuhi kualitas yang diharapkan. Oleh karena itu, agar
soal-soal yang dikembangkan memenuhi kriteria yang dikembangkan perlulah kiranya
dilakukan analisis sehingga dapat diketahui kualitas soal yang digunakan untuk mengukur

kemampuan mahasiswa.

METODE PENELITIAN
Tempat dan Waktu Penelitian
Penelitian ini dilaksanakan di Program Studi Pendidikan Matematika Fakultas Keguruan
dan Ilmu Pendidikan Universitas Khairun, sedangkan waktu penelitian dilaksanakan pada
bulan Januari 2012.
Jenis Penelitian
Jenis penelitian ini merupakan penelitian deskriptif. Penelitian ini akan mendeskripsikan
tingkat kesukaran, indeks daya beda, keberfungsian pengecoh, reliabilitas, dan validitas tiap
butir soal serta menghitung eror standar pengukuran instrumen.
Subjek Penelitian
Subjek penelitian ini adalah mahasiswa Program Studi pendidikan Matematika
Universitas Khairun yang mengikuti mata kuliah himpunan dan logika matematika pada
semester gasal tahun ajaran 2011/2012 dengan jumlah total mahasiswa sebanyak 88 orang.
Teknik Pengumpulan Data
Data dalam penelitian ini dikumpulkan melalui tes yang dilakukan pada saat ujian akhir
semester gasal tahun ajaran 2011/2012 yang berupa jawaban mahasiswa atas soal pilihan
ganda yang diujikan.
Teknik Analisis Data

Analisis data dilakukan secara deskriptif dengan menggunakan bantuan Iteman dan
SPSS. Analisis dengan Iteman digunakan untuk mengetahui tingkat kesukaran, indeks daya
beda, dan keberfungsian pengecoh tiap butir soal serta eror standar pengukuran instrumen.
Analisis dengan SPSS digunakan untuk mengetahui reliabilitas dan validitas instrumen.

Prosiding Seminar Pendidikan ke -3

Page 63

ISSN : 2089 - 5488

HASIL PENELITIAN DAN PEMBAHASAN
a. Tingkat Kesukaran
Tingkat kesukaran untuk tiap butir soal ditentukan berdasarkan tiga kategori, yaitu
tingkat kesukaran 0,00 0,30 berarti sukar, 0,31 0,70 berarti sedang, dan 0,71 1,00 berarti
mudah (Depdiknas, 2008: 9). Hasil analisis dengan program Iteman terhadap 50 butir soal
yang dianalisis menunjukkan bahwa: (1) terdapat 9 (18%) butir soal yang tergolong sukar,
yaitu soal nomor 6, 14, 20, 22, 28, 34, 40, 44, dan 46, (2) terdapat 37 (74%) butir soal yang
tergolong sedang, yaitu soal nomor 1, 2, 3, 4. 5, 7, 8, 9, 10, 11, 13, 15, 16, 17, 18, 19, 21, 23,
24, 25, 27, 29, 30, 31, 32, 33, 35, 36, 38, 39, 42, 43, 45, 47, 48, 49, dan 50, dan (3) terdapat 4

(8%) butir soal yang tergolong mudah, yaitu soal nomor 12, 26, 37 dan 41. Secara keseluruhan,
rata-rata tingkat kesukaran butir soal adalah sebesar 0,414, yang berarti tingkat kesukaran soal
ujian tersebut termasuk dalam kategori sedang.
b. Indeks Daya Beda
Ideks daya beda dapat dipergunakan untuk menentukan kualitas butir soal. Ebel & Frisbie
(1986: 234), menyebutkan bahwa butir soal yang sangat bagus memiliki indeks daya beda
0,40, butir soal yang layak tetapi mungkin untuk diperbaiki memiliki indeks daya beda
berkisar antara 0,30 -. 0,39, butir saol yang perlu diperbaiki memiliki kisaran indeks daya
beda antara 0,20 - 0,29, dan butir soal yang tidak dipakai atau diperbaiki memiliki indeks data
beda 0,19. Berdasarkan analisis yang dilakukan diketahui bahwa: (1) terdapat 28 (56%)
butir soal yang dapat dikatakan memiliki kriteria yang sangat bagus, yaitu butir soal nomor 3,
4, 5, 7, 10, 14, 15, 16, 17, 18, 19, 20, 25, 26, 27, 30, 33, 35, 37, 38, 41, 42, 43, 45, 48, 49, dan
50, (2) terdapat 7 (14%) butir soal yang layak tetapi mungkin untuk diperbaiki, yaitu butir
soal nomor 9, 28, 31, 36, 39, 46, dan 47, (3) terdapat 5 (10%) butir soal yang perlu diperbaiki,
yaitu butir soal nomor 2, 11, 12, 21, dan 23, dan (4) terdapat 10 (20%) butir soal yang tidak
perlu dipakai atau diperbaiki, yaitu soal nomor 1, 6, 13, 22, 24, 29, 32, 34, 40, dan 44. Ratarata indeks daya beda soal ujian adalah sebesar 0,384, jadi secara keseluruhan dapat dikatakan
bahwa butir soal dapat diterima atau layak tetapi mungkin untuk diperbaiki.
c. Keberfungsian Pengecoh
Efektivitas pengecoh atau distraktor dapat dilihat dari dua kriteria, yaitu (a) distraktor
dipilih oleh siswa dari kelompok rendah, dan (b) pemilih distraktor tersebar relatif

proporsional pada masing-masing distraktor yang ada (Azwar, 2007: 142). Sebagian
distraktor dapat berfungsi dengan baik. Hal tersebut dapat diliat dari jumlah butir soal yang
distraktornya dipilih oleh siswa dari kelompok rendah, yaitu sebanyak 39 (78%) butir soal,
sedangkan jumlah distraktor yang dipilih oleh siswa dari kelompok atas terdiri dari 11 (22%)
butir soal, yaitu butir soal nomor 1, 6, 13, 22, 23, 24, 29, 32, 34, 40, dan 44. Sebagian
distraktor dapat dikatakan proporsional pada masing-masing distraktor yang ada dan hanya
dua butir soal yang distraktornya ada yang tidak berfungsi sama sekali yaitu butir soal nomor
26 dan 41.
d. Eror Standar dalam Pengukuran (Standard Error of Measurement)
Standard error of measrement dapat memperkirakan kemungkinan besar perbedaan skor
yang diperoleh siswa dengan skor sesungguhnya (Nitko dan Brookhart, 2007: 76). Semakin
kecil harga SEM maka pengukuran maka pengukuran semakin cermat dan dapat dipercaya
(Azwar, 2008: 120). Berdasarkan hasil analisis butir soal dengan Iteman diketahui bahwa
Standard Error of Measurement (SEM) soal ujian yang dianalisis adalah 3,120.
e. Reliabilitas Instrumen
Suatu instrumen dikatakan reliabel apabila nilai Cobach Alpha lebih besar dari 0,60
(Nunnally cit. Ghozali, 2001: 140). Berdasarkan analisis dengan Iteman maupun dengan
SPSS diketahui bahwa nilai Cobach Alpha sebesar 0,787. Berdasarkan hal tersebut maka
dapat dikatakan bahwa soal ujian yang dianalisis cukup reliable.
f. Validitas Instrumen

Prosiding Seminar Pendidikan ke -3

Page 64

ISSN : 2089 - 5488

Menurut Azwar (2008: 45) berdasarkan cara estimasinya yang disesuaikan dengan sifat
dan fungsi setiap tes, tipe validasi biasanya digolongkan dalam tiga kategori, yaitu validitas
isi, validitas konstruk, dan validitas berdasarkan kriteria. Berdasarkan analisi dengan bantuan
SPSS maka dapat diketahui validitas konstruk soal ujian ini. Uji validitas dilakukan dengan
menghitung korelasi antara skor masing-masig butir pertanyaan dengan total skor (nilai).
Berdasarkan analisi tersebut didapatkan 14 (28%) butir soal yang tidak valid, yaitu butir soal
nomor 1, 2, 6, 11, 12, 21, 22, 24, 29, 32, 34, 40, 44, dan 47. Selain itu, terdapat 36 (72%) butir
soal yang valid, yaitu butir soal nomor 3, 4, 5, 7, 8, 9, 10, 13, 14, 15, 16, 17, 18, 19, 20, 23,
25, 26, 27, 28, 30, 31, 33, 35, 36, 37, 38, 39, 41, 42, 43, 45, 46, 48, 49, dan 50.
Butir soal nomor 1 memiliki tingkat kesukaran 0,534, sehingga dapat tergolong sedang
dan memiliki indeks daya beda 0,153, sehingga butir soal ini seharusnya tidak dipakai atau
diperbaiki hal tersebut disebabkan butir soal ini tidak bisa membedakan siswa dari kelompok
atas dan bawah. Pengecoh butir soal ini juga tidak maksimal hal tersebut dilihat dari proporsi
siswa (0,205; 0,193; dan 0,068). Walaupun reliabel (0,790), namun butir soal ini tidak valid

(p-value = 0,257).
Butir soal nomor 2 memiliki tingkat kesukaran 0,318, sehingga dapat tergolong sedang
dan memiliki indeks daya beda 0,223, sehingga butir soal perlu diperbaiki. Pengecoh butir
soal bekerja maksimal hal tersebut dilihat dari proporsi jawaban siswa (0,193; 0,205; dan
0,261). Walaupun reliabel (0,788), namun butir soal ini tidak valid (p-value = 0,112).
Butir soal nomor 3 memiliki tingkat kesukaran 0,557, sehingga dapat tergolong sedang
dan memiliki indeks daya beda 0,752, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini tidak bekerja maksimal hal tersebut dilihat dari proporsi
siswa (0,205; 0,023; dan 0,216). Butir soal ini reliabel (0,773) dan valid (p-value < 0,05).
Butir soal nomor 4 memiliki tingkat kesukaran 0,398, sehingga dapat tergolong sedang
dan memiliki indeks daya beda 0,567, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja cukup maksimal hal tersebut dilihat dari
proporsi siswa (0,182; 0,159; dan 0,216). Butir soal ini reliabel (0,779) dan valid (p-value <
0,05).
Butir soal nomor 5 memiliki tingkat kesukaran 0,330, sehingga dapat tergolong sedang
dan memiliki indeks daya beda 0,768, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
siswa (0,455; 0,080; dan 0,125). Butir soal ini reliabel (0,774) dan valid (p-value < 0,05).
Butir soal nomor 6 memiliki tingkat kesukaran 0,170, sehingga dapat tergolong sukar dan
memiliki indeks daya beda 0,165, sehingga butir soal ini seharusnya tidak dipakai atau

diperbaiki. Pengecoh butir soal ini juga tidak maksimal hal tersebut dilihat dari proporsi siswa
(0,182; 0,250; dan 0,386). Walaupun reliabel (0,789), namun butir soal ini tidak valid (p-value
= 0,302).
Butir soal nomor 7 memiliki tingkat kesukaran 0,341, sehingga dapat tergolong sedang
dan memiliki indeks daya beda 0,526, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
siswa (0,227; 0,273; dan 0,159). Butir soal ini reliabel (0,780) dan valid (p-value < 0,05).
Butir soal nomor 8 memiliki tingkat kesukaran 0,409, sehingga dapat tergolong sedang
dan memiliki indeks daya beda 0,866, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
siswa (0,102; 0,193; dan 0,295). Butir soal ini reliabel (0,769) dan valid (p-value < 0,05).
Butir soal nomor 9 memiliki tingkat kesukaran 0,511, sehingga dapat tergolong sedang
dan memiliki indeks daya beda 0,353, sehingga butir soal ini dapat digolongkan dalam kriteria
layak tetapi mungkin untuk diperbaiki. Pengecoh butir soal ini bekerja tidak maksimal hal
tersebut dilihat dari proporsi jawaban siswa (0,023; 0,125; dan 0,295). Butir soal ini reliabel
(0,785) dan valid (p-value < 0,05).

Prosiding Seminar Pendidikan ke -3

Page 65


ISSN : 2089 - 5488

Butir soal nomor 10 memiliki tingkat kesukaran 0,352, sehingga dapat tergolong sedang
dan memiliki indeks daya beda 0,548, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja cukup maksimal hal tersebut dilihat dari
proporsi jawaban siswa (0,148; 0,227; dan 0,261). Butir soal ini reliabel (0,780) dan valid (pvalue < 0,05).
Butir soal nomor 11 memiliki tingkat kesukaran 0,386, sehingga dapat tergolong sedang
dan memiliki indeks daya beda 0,210, sehingga butir soal ini seharusnya diperbaiki. Pengecoh
butir soal ini juga tidak maksimal hal tersebut dilihat dari proporsi jawaban siswa (0,330;
0,136; dan 0,146). Walaupun reliabel (0,789), namun butir soal ini tidak valid (p-value =
0,124).
Butir soal nomor 12 memiliki tingkat kesukaran 0,784, sehingga dapat tergolong mudah
dan memiliki indeks daya beda 0,252, sehingga butir soal ini seharusnya diperbaiki. Pengecoh
butir soal ini bekerja cukup baik hal tersebut dilihat dari proporsi jawaban siswa (0,057;
0,080; dan 0,080). Walaupun reliabel (0,787), namun butir soal ini tidak valid (p-value =
0,094).
Butir soal nomor 13 memiliki tingkat kesukaran 0,375, sehingga dapat tergolong sedang
dan memiliki indeks daya beda -0,352, sehingga butir soal ini seharusnya tidak dipakai atau
diperbaiki. Pengecoh butir soal ini juga tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,352; 0,057; dan 0,170). Butir soal ini reliabel (0,803) dan valid (p-value <
0,05).
Butir soal nomor 14 memiliki tingkat kesukaran 0,193, sehingga dapat tergolong sukar
dan memiliki indeks daya beda 0,444, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,307; 0,182; dan 0,295). Butir soal ini reliabel (0,784) dan valid (p-value <
0,05).
Butir soal nomor 15 memiliki tingkat kesukaran 0,375, sehingga dapat tergolong sedang
dan memiliki indeks daya beda 0,680, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,193; 0,352; dan 0,080). Butir soal ini reliabel (0,776) dan valid (p-value <
0,05).
Butir soal nomor 16 memiliki tingkat kesukaran 0,455, sehingga dapat tergolong sedang
dan memiliki indeks daya beda 0,799, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,159; 0,307; dan 0,068). Butir soal ini reliabel (0,771) dan valid (p-value <
0,05).
Butir soal nomor 17 memiliki tingkat kesukaran 0,432, sehingga dapat tergolong sedang
dan memiliki indeks daya beda 0,547, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja cukup maksimal hal tersebut dilihat dari
proporsi jawaban siswa (0,216; 0,148; dan 0,182). Butir soal ini reliabel (0,779) dan valid (pvalue < 0,05).
Butir soal nomor 18 memiliki tingkat kesukaran 0,307, sehingga dapat tergolong sedang
dan memiliki indeks daya beda 0,536, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,330; 0,114; dan 0,205). Butir soal ini reliabel (0,780) dan valid (p-value <
0,05).
Butir soal nomor 19 memiliki tingkat kesukaran 0,455 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,404, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,182; 0,307; dan 0,057). Butir soal ini reliabel (0,783) dan valid (p-value <
0,05).

Prosiding Seminar Pendidikan ke -3

Page 66

ISSN : 2089 - 5488

Butir soal nomor 20 memiliki tingkat kesukaran 0,045 dan digolongkan dalam kriteria
sukar. Indeks daya beda 0,686, sehingga butir soal ini dapat digolongkan dalam kriteria sangat
bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,136; 0,648; dan 0,170). Butir soal ini reliabel (0,784) dan valid (p-value <
0,05).
Butir soal nomor 21 memiliki tingkat kesukaran 0,352 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,263, sehingga butir soal ini perlu diperbaiki. Pengecoh butir soal
ini bekerja tidak maksimal hal tersebut dilihat dari proporsi jawaban siswa (0,295; 0,182; dan
0,148). Butir soal ini reliabel (0,787) dan tidak valid (p-value = 0,056).
Butir soal nomor 22 memiliki tingkat kesukaran 0,352 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,263, sehingga butir soal ini perlu diperbaiki. Pengecoh butir soal
ini bekerja tidak maksimal hal tersebut dilihat dari proporsi jawaban siswa (0,125; 0,352; dan
0,398). Butir soal ini reliabel (0,788) dan tidak valid (p-value = 0,289).
Butir soal nomor 23 memiliki tingkat kesukaran 0,307 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,282, sehingga butir soal ini perlu diperbaiki. Pengecoh butir soal
ini bekerja tidak maksimal hal tersebut dilihat dari proporsi jawaban siswa (0,318; 0,261; dan
0,091). Butir soal ini reliabel (0,787) dan valid (p-value < 0,05).
Butir soal nomor 24 memiliki tingkat kesukaran 0,307 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,043, sehingga butir soal ini tidak dipakai atau diperbaiki.
Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi jawaban
siswa (0,159; 0,330; dan ,205). Butir soal ini reliabel (0,793) dan tidak valid (p-value =
0,760).
Butir soal nomor 25 memiliki tingkat kesukaran 0,330 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,471, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,182; 0,159; dan 0,295). Butir soal ini reliabel (0,782) dan valid (p-value <
0,05).
Butir soal nomor 26 memiliki tingkat kesukaran 0,705 dan digolongkan dalam kriteria
mudah. Indeks daya beda 0,697, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa dan juga terdapat distraktor yang tidak berfungsi (0,170; 0,114; dan 0,000).
Butir soal ini reliabel (0,776) dan valid (p-value < 0,05).
Butir soal nomor 27 memiliki tingkat kesukaran 0,352 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,504, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,136; 0,125; dan 0,386). Butir soal ini reliabel (0,793) dan valid (p-value <
0,05).
Butir soal nomor 28 memiliki tingkat kesukaran 0,227 dan digolongkan dalam kriteria
sukar. Indeks daya beda 0,369, sehingga butir soal ini layak tetapi mungkin untuk diperbaiki.
Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi jawaban
siswa (0,227; 0,364; dan 0,170). Butir soal ini reliabel (0,785) dan valid (p-value < 0,05).
Butir soal nomor 29 memiliki tingkat kesukaran 0,307 dan digolongkan dalam kriteria
sedang. Indeks daya beda -0,024, sehingga butir soal ini tidak dipakai atau diperbaiki.
Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi jawaban
siswa (0,420; 0,159; dan 0,091). Butir soal ini reliabel (0,794) dan valid (p-value = 0,868).
Butir soal nomor 30 memiliki tingkat kesukaran 0,375 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,463, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,443; 0,114; dan 0,045). Butir soal ini reliabel (0,782) dan valid (p-value <
0,05).

Prosiding Seminar Pendidikan ke -3

Page 67

ISSN : 2089 - 5488

Butir soal nomor 31 memiliki tingkat kesukaran 0,466 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,383, sehingga butir soal ini layak tetapi mungkin untuk
diperbaiki. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0193; 0,318; dan 0,023). Butir soal ini reliabel (0,784) dan valid (p-value <
0,05).
Butir soal nomor 32 memiliki tingkat kesukaran 0,364 dan digolongkan dalam kriteria
sedang. Indeks daya beda -0,191, sehingga butir soal ini tidak dipakai atau diperbaiki.
Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi jawaban
siswa (0,352; 0,102; dan 0,136). Butir soal ini reliabel (0,799) dan tidak valid (p-value =
0,166).
Butir soal nomor 33 memiliki tingkat kesukaran 0,614 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,597, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja cukup maksimal hal tersebut dilihat dari
proporsi jawaban siswa (0,102; 0,148; dan 0,136). Butir soal ini reliabel (0,778) dan valid (pvalue < 0,05).
Butir soal nomor 34 memiliki tingkat kesukaran 0,295 dan digolongkan dalam kriteria
sukar. Indeks daya beda 0,009, sehingga butir soal ini tidak dipakai atau diperbaiki. Pengecoh
butir soal ini bekerja maksimal hal tersebut dilihat dari proporsi jawaban siswa (0,239; 0,205;
dan 0,239). Butir soal ini reliabel (0,793) dan tidak valid (p-value = 0,951).
Butir soal nomor 35 memiliki tingkat kesukaran 0,614 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,466, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,136; 0,068; dan 0,182). Butir soal ini reliabel (0,782) dan valid (p-value <
0,05).
Butir soal nomor 36 memiliki tingkat kesukaran 0,364 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,355, sehingga butir soal ini layak tetapi mungkin untuk
diperbaiki. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,091; 0,364; dan 0,170). Butir soal ini reliabel (0,785) dan valid (p-value <
0,05).
Butir soal nomor 37 memiliki tingkat kesukaran 0,830 dan digolongkan dalam kriteria
mudah. Indeks daya beda 0,643, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus karena. Pengecoh butir soal ini bekerja cukup maksimal hal tersebut dilihat dari
proporsi jawaban siswa (0,057; 0,091; dan 0,023). Butir soal ini reliabel (0,780) dan valid (pvalue < 0,05).
Butir soal nomor 38 memiliki tingkat kesukaran 0,648 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,506, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,057; 0,125; dan 0,170). Butir soal ini reliabel (0,781) dan valid (p-value <
0,05).
Butir soal nomor 39 memiliki tingkat kesukaran 0,330 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,369, sehingga butir soal ini layak tetapi mungkin untuk
diperbaiki. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,182; 0,250; dan 0,239). Butir soal ini reliabel (0,784) dan valid (p-value <
0,05).
Butir soal nomor 40 memiliki tingkat kesukaran 0,227 dan digolongkan dalam kriteria
sukar. Indeks daya beda -0,060, sehingga butir soal ini tidak dipakai atau diperbaiki.
Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi jawaban
siswa (0,091; 0,477; dan 0,182). Butir soal ini reliabel (0,794) dan tidak valid (p-value =
0,690).
Butir soal nomor 41 memiliki tingkat kesukaran 0,852 dan digolongkan dalam kriteria
mudah. Indeks daya beda 0,565, sehingga butir soal ini dapat digolongkan dalam kriteria
Prosiding Seminar Pendidikan ke -3

Page 68

ISSN : 2089 - 5488

sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa dan ada pengecoh yang tidak berfungsi (0,102; 0,000; dan 0,045). Butir soal
ini reliabel (0,782) dan valid (p-value < 0,05).
Butir soal nomor 42 memiliki tingkat kesukaran 0,466 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,517, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,057; 0,102; dan 0,364). Butir soal ini reliabel (0,783) dan valid (p-value <
0,05).
Butir soal nomor 43 memiliki tingkat kesukaran 0,693 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,631, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,205; 0,068; dan 0,034). Butir soal ini reliabel (0,778) dan valid (p-value <
0,05).
Butir soal nomor 44 memiliki tingkat kesukaran 0,148 dan digolongkan dalam kriteria
sukar. Indeks daya beda -0,106, sehingga butir soal ini tidak dipakai atau diperbaiki.
Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi jawaban
siswa (0,216; 0,318; dan 0,295). Butir soal ini reliabel (0,793) dan tidak valid (p-value =
0,522).
Butir soal nomor 45 memiliki tingkat kesukaran 0,625 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,538, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja cukup maksimal hal tersebut dilihat dari
proporsi jawaban siswa (0,102; 0,148; dan 0,114). Butir soal ini reliabel (0,780) dan valid (pvalue < 0,05).
Butir soal nomor 46 memiliki tingkat kesukaran 0,295 dan digolongkan dalam kriteria
sukar. Indeks daya beda 0,490, sehingga butir soal ini dapat digolongkan dalam kriteria sangat
bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,102; 0,250; dan 0,341). Butir soal ini reliabel (0,782) dan valid (p-value <
0,05).
Butir soal nomor 47 memiliki tingkat kesukaran 0,398 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,218, sehingga butir soal ini perlu diperbaiki. Pengecoh butir soal
ini bekerja tidak maksimal hal tersebut dilihat dari proporsi jawaban siswa (0,489; 0,045; dan
0,045). Butir soal ini reliabel (0,789) dan tidak valid (p-value = 0,109).
Butir soal nomor 48 memiliki tingkat kesukaran 0,375 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,503, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,318; 0,193; dan 0,080). Butir soal ini reliabel (0,781) dan valid (p-value <
0,05).
Butir soal nomor 49 memiliki tingkat kesukaran 0,682 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,596, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,114; 0,125; dan 0,068). Butir soal ini reliabel (0,779) dan valid (p-value <
0,05). Butir soal nomor 50 memiliki tingkat kesukaran 0,580 dan digolongkan dalam kriteria
sedang. Indeks daya beda 0,581, sehingga butir soal ini dapat digolongkan dalam kriteria
sangat bagus. Pengecoh butir soal ini bekerja tidak maksimal hal tersebut dilihat dari proporsi
jawaban siswa (0,045; 0,148; dan 0,205). Butir soal ini reliabel (0,778) dan valid (p-value <
0,05).
KESIMPULAN
Berdasarkan analisis data hasil penelitian, maka dapat disimpulkan hal-hal sebagai
berikut.

Prosiding Seminar Pendidikan ke -3

Page 69

ISSN : 2089 - 5488

a. Secara keseluruhan rata-rata tingkat kesukaran butir soal adalah sebesar 0,414, yang
berarti tingkat kesukaran soal ujian tersebut termasuk dalam kategori sedang.
b. Rata-rata indeks daya beda soal ujian adalah sebesar 0,384 dan dapat dikatakan bahwa
butir soal dapat diterima atau layak tetapi mungkin untuk diperbaiki.
c. Sebagian distraktor dapat dikatakan proporsional pada masing-masing distraktor yang ada
dan hanya dua butir soal yang distraktornya ada yang tidak berfungsi sama sekali yaitu
butir soal nomor 26 dan 41.
d. Standard Error of Measurement (SEM) soal ujian yang dianalisis adalah 3,120.
e. Nilai Cobach Alpha sebesar 0,787, sehingga dapat dikatakan bahwa soal ujian yang
dianalisis cukup reliabel.
f. Terdapat 14 (28%) butir soal yang tidak valid dan 36 (72%) butir soal yang valid.
Berdasarkan penelitian dan yang telah dilakukan, maka disarankan kepada pengembang
dan pengguna instrumen ini, yaitu sebagai berikut.
a. Rata-rata tingkat kesukaran butir soal perlu ditingkatkan agar diperoleh rata-rata tingkat
kesukaran yang ideal yaitu skitar 0,50.
b. Rata-rata indek daya beda juga perlu ditingkatkan agar diperoleh rata-rata indeks daya
beda yang lebih besar atau sama dengan 0,40.
c. Perlu kiranya menbuat distraktor yang dapat berfungsi dengan baik agar diperoleh proposi
yang relatif sama pada masing-masing distraktor.
d. SEM diupayakan diperkecil, agar kesalahan dalam pengukuran semakin kecil.
e. Nilai Cobach Alpha juga perlu ditingkatkan karena apabila nilai Cobach Alpha semakin
dekat ke 1 maka semakin baik.
f. Perlu ditingkatkan jumlah butir soal yang valid agar soal ujian yang digunakan benarbenar dapat mengukur kemampuan mahasiswa.
DAFTAR PUSTAKA
Azwar, S. 2007. Tes Prestasi. Yogyakarta: Pustaka Pelajar.
Azwar, S. 2008. Realibilitas dan Validitas. Yogyakarta: Pustaka Pelajar.
Depdiknas. 2008. Panduan Analisis Butir Soal. Jakarta: Direktorat Jenderal Manajemen
Pendidikan Dasar dan Menengah.
Ebel, R.L. dan Frisbie, D.A. 1986. Essentials of Educational Measurement (4th ed.). New
Jersey: Prentice-Hall, Inc.
Ghozali, I. 2001. Aplikasi Analisis Multivariate dengan Pogram SPSS. Semarang: Badan
Penerbit Universitas Diponegoro.
Guilford, J.P dan Fruchter, B. 1981. Fundamental Statistics in Psychology and Education.
Singapore: McGraw-Hill International Book Co.
Hayat, B., Pranata, S.S., dan Suprananto. 1997. Manual Item and Test Analysis (ITEMAN).
Jakarta: Pusat Penelitian dan Pengembangan Sistem Pengujian, Balitbang Departemen
Pendidikan dan Kebudayaan.
Linn, R.L. dan Gronlund, N.E. 1995. Measurement and Assessment in Teaching (7th Ed.).
Ohio: Merrill Prentice Hall.
Mardapi, D. 2008. Teknik Penyusunan Instrumen Tes dan Nontes. Yogyakarta: Mitra
Cendikia Press.
Nitko, A.J. 1996. Educational Assessment of Students (2nd ed.). Ohio: Prentice Hall
Englewood Cliffs.
Nitko, A.J. dan Brookhart, S.M. 2007. Educational Assessment of Students (5th ed.). New
Jersey: Pearson Education, Inc.
Popham, J.W. 1995. Classroom Assessment: What Teachers Need to Know. Boston: Allyn
and Bacon.
Prosiding Seminar Pendidikan ke -3

Page 70

Dokumen yang terkait

Analisis Komparasi Internet Financial Local Government Reporting Pada Website Resmi Kabupaten dan Kota di Jawa Timur The Comparison Analysis of Internet Financial Local Government Reporting on Official Website of Regency and City in East Java

19 819 7

Analisis komparatif rasio finansial ditinjau dari aturan depkop dengan standar akuntansi Indonesia pada laporan keuanagn tahun 1999 pusat koperasi pegawai

15 355 84

Analisis Komposisi Struktur Modal Pada PT Bank Syariah Mandiri (The Analysis of Capital Structure Composition at PT Bank Syariah Mandiri)

23 288 6

Analisis Konsep Peningkatan Standar Mutu Technovation Terhadap Kemampuan Bersaing UD. Kayfa Interior Funiture Jember.

2 215 9

FREKWENSI PESAN PEMELIHARAAN KESEHATAN DALAM IKLAN LAYANAN MASYARAKAT Analisis Isi pada Empat Versi ILM Televisi Tanggap Flu Burung Milik Komnas FBPI

10 189 3

Analisis Sistem Pengendalian Mutu dan Perencanaan Penugasan Audit pada Kantor Akuntan Publik. (Suatu Studi Kasus pada Kantor Akuntan Publik Jamaludin, Aria, Sukimto dan Rekan)

136 695 18

Analisis Penyerapan Tenaga Kerja Pada Industri Kerajinan Tangan Di Desa Tutul Kecamatan Balung Kabupaten Jember.

7 76 65

Analisis Pertumbuhan Antar Sektor di Wilayah Kabupaten Magetan dan Sekitarnya Tahun 1996-2005

3 59 17

Analisis tentang saksi sebagai pertimbangan hakim dalam penjatuhan putusan dan tindak pidana pembunuhan berencana (Studi kasus Perkara No. 40/Pid/B/1988/PN.SAMPANG)

8 102 57

Analisis terhadap hapusnya hak usaha akibat terlantarnya lahan untuk ditetapkan menjadi obyek landreform (studi kasus di desa Mojomulyo kecamatan Puger Kabupaten Jember

1 88 63