Tinjauan Pustaka

4. Penyusunan Tes

Menyusun dan mengembangkan tes obyektif yang baik sangat sukar, karena tes yang baik harus memenuhi beberapa syarat. Pengembangan tes obyektif harus menurui kaidah kaidah, berupa langkah langkah yang perlu dikuti.

Ada sembilan langkah yang perlu ditempuh dalam mengembangkan tes hasil atau prestasi belajar (Djemari Mardapi, 2008: 88), yaitu: (a) menyusun spesifikasi tes, (b) menulis soal tes, (c) menelaah soal tes atau analisis secara kualitatif, (d) melakukan ujicoba tes, (e) menganalisis butir soal atau analisis secara kuantitatif, (f) memperbaiki tes, (g) merakit tes, (h) melaksanakan tes, (i) menafsirkan hasil tes.

a. Menyususn Spesifikasi Tes

Langkah awal dalam mengembangkan tes adalah menyusun spesifikasi tes yang meliputi tujuan tes, menyusun kisi-kisi tes, memilih bentuk tes, dan menentukan panjang tes. Tujuan tes di sini apakah itu untuk tes sumatif, formatif, diagnostik atau penempatan dari keempat tujuan tes tersebut tes yang akan disusun untuk penelitian ini adalah tes jenis formatif yang berupa tes tengah semester dimana tes ini ditujukan untuk mengukur kemampuan kognitif peserta tes. Tujuan harus ditentukan paling awal karena akan mempengaruhi pada tahap-tahap selanjutnya. Setelah tujuan ditetapkan langkah selanjutnya yaitu menyusun kisi-kisi tes.

Menurut Nana Sudjana (2005:22) ranah kognitif berkenaan dengan hasil belajar intelektual yang terdiri dari enam aspek, yakni pengetahuan atau ingatan, pemahaman, aplikasi, analisis, sintesis dan evaluasi. Kedua aspek pertama disebut kognitif tingkat rendah dan keempat aspek berikutnya termasuk kognitif tingkat tinggi. Pada awal perkembangannya Bloom membagi ranah kognitif ke dalam taxonomi Bloom yang terdiri dari enam tingkat. Namun, selanjutnya Lorin W

commit to user

terhadap taksonomi pendidikan Bloom. Mereka membagi dimensi proses kognitif menjadi emam bagian yaitu:

1) Mengingat, merupakan proses mengambil pengetahuan yang dibutuhkan dari memori jangka panjang.

2) Memahami, merupakan proses mengkonstruksi makna dari materi pelajaran, termasuk apa yang diucapkan ditulis dan digambar oleh guru.

3) Mengaplikasikan, merupakan proses menerapkan atau menggunakan suatu prosedur dalam keadaan tertentu.

4) Menganalisis, adalah proses memecah-mecah materi dari bagain-bagian penyusunnya dan menentukan hubungan-hubungan antar bagian tersebut dengan keseluruhan struktur atau tujuan.

5) Mengevaluasi, adalah proses mengambil keputusan berdasarkan kriteria dan/ atau standar.

6) Mencipta, adalah proses memadukan bagian-bagian untuk membentuk sesuatu yang baru dan koheren atau untuk membuat suatu produk yang orisinal.

Kisi-kisi merupakn tabel matriks yang berisi spesifikasi soal-soal yang akan dibuat (Djemari Mardapi: 2008: 90). Ketika menyusun kisi-kisi penting untuk mempertimbangkan distribusi kemampuan kognitif yang akan diujikan, dimana dalam satu paket soal jumlah soal yang ditujukan untuk mengukur kemampuan ingatan, pemahaman, pengaplikasian dan evaluasi harus proporsional. Kisi-kisi merupakan acuan bagi penulis soal, sehingga siapapun yang menulis soal akan menghasilkan isi dan tingkat kesulitan yang relatif sama. Ada empat langkah mengembangkan kisi-kisi tes (Djemari Mardapi, 2008: 90)yaitu:

1) Menulis standar kompetensi dan kompetensi dasar.

2) Menentukan indikator

3) Membuat daftar pokok bahasan dan subpokok bahasan yang akan diujikan.

4) Menentukan jumlah soal tiap pokok bahasan dan sub pokok bahasan.

commit to user

kisi-kisi tes adalah merumuskan setepat mungkin ruang lingkup, tekanan tes dan bagiannya, sehingga perumusan tersebut dapat menjadi petunjuk yang efektif bagi si penyusun tes (Chabib Thoha, 1994:32). Kisi-kisi di sini mencakup materi yang akan diteskan, SK, KD, dan indikator-indikator yang ingin dicapai. Kisi-kisi soal yang baik harus memenuhi syarat-syarat sebagai berikut:

1) mewakili isi kurikulum yang akan diujikan;

2) komponen-komponennya rinci, jelas, dan mudah dipahami;

3) soal-soalnya dapat dibuat sesuai dengan indikator dan bentuk soal yang ditetapkan. (Balitbang-Depdiknas, 2007:6)

Langkah selanjutnya yaitu menentukan bentuk tes. Apakah nantinya tes tersebut bentuknya objektif atau subjektif. Objektif disini bisa berupa pilihan ganda, menjodohkan, benar salah dan sebagainya. Bentuk tes yang akan disusun adalah tes objektif pilihan ganda biasa dengan lima alternatif jawaban. Sehingga peluang jawaban benar untuk tiap alternatif jawaban adalah 20% dengan begitu ketika terdapat siswa yang melakukan spekulasi jawaban peluangnya untuk menjawab benar relatif rendah. Secara umum, setiap soal pilihan ganda terdiri dari pokok soal (stem) dan pilihan jawaban (option). Pilihan jawaban terdiri atas kunci jawaban dan pengecoh (distractor).

Langkah selanjutnya adalah menentukan panjang tes. Panjang tes disini dipertimbangkan dari waktu yang diperlukan dalam pelaksaan tes dan waktu pengerjaan tiap soal. Menurut Chabib Toha (1994:37-38), “ lamanya pengerjaan soal tidak terkait dengan tingkat kesukaran soal tetapi lebih ditentukan oleh sifat soal, dan tujuan evaluasi, yakni apakah dalam evaluasi akan mengukur kecepatan (speed test) ataukah ingin mengukur kekuatan (power test)”. Namun untuk tes tertulis pada umumnya menggunakan waktu 90 sampai 150 menit sehingga waktu yang diperlukan untuk mengerjakan soal pilihan ganda adalah 2 sampai 3 menit untuk tiap butir soal (Djemari Mardapi, 2008: 92).

commit to user

Tahapan selanjutnya adalah penulisan soal. Menurut Djemari Mardapi, “Penulisan soal merupakan langkah penjabaran indikator menjadi pertanyaan-pertanyaan yang karekteristiknya sesuai dengan perincian pada kisi-ikisi yang telah dibuat” (2008: 93) . Setiap soal dalam tes akan menghasilkan unit informasi tertentu mengenai orang yang akan mengerjakan tes. Dalam penyusunan soal tes tertulis, penulis soal harus memperhatikan kaidah-kaidah penulisan soal dilihat dari segi materi, konstruksi, maupun bahasa. Selain itu soal yang dibuat hendaknya menuntut penalaran yang tinggi (Balitbang-Depdiknas, 2007:6).

Untuk membuat tes pilihan ganda tidaklah mudah banyak aspek yang perlu diperhatikan. Dari fakta itulah maka Djemari Mardapi (2008:

72) menyatakan pedoman utama dalam pembuatan butir soal bentuk pilihan ganda, yang terdiri dari: (1) pokok soal harus jelas, (2) pilhan jawaban homogen dalam arti isi, (3) panjang kalimat pilihan jawaban relatif sama, (4) tidak ada petunjuk jawaban benar, (5) hindari menggunakan pilihan jawaban semua benar atau semua salah, (6) pilihan jawaban angka diurutkan, (7) semua pilihan jawaban logis, (8) jangan menggunakan negatif ganda, (9) kalimat yang digunakan sesuai dengan tingkat perkembangan peserta tes, (10) bahasa Indonesia yang digunakan baku, (11) letak pilihan jawaban benar ditentukan secara acak.

Pada umumnya, penulisan aitem dalam tes objektif tipe pilihan ganda banyak didasarkan pada proposisi, yaitu suatu kalimat sederhana yang dapat dinyatakan sebagai benar atau salah. Proposisi biasanya dikembangkan dalam tipe pilihan ganda yang jawabannya tidak sekedar benar dan salah akan tetapi berupa pilihan terhadap pernyataan yang paling benar atau paling tepat.(Saifuddin Azwar, 2002: 81).

c. Menelaah Soal Tes atau Analisis secara Kualitatif

Pengujian kualitas secara teoritis sering disebut dengan telaah soal. Telaah ini pada dasarnya menekankan pada penilaian segi materi, kontruksi dan bahasa dari butir soal yang dibuat Depdikbud. Penelaahan

commit to user

masih ditemukan kekurangan dan kesalahan. Penelaahan soal sebaiknya dilakukan oleh orang lain dan lebih baik lagi jika telaah dilakukan oleh sejumlah orang yang terdiri dari para ahli yang secara bersama-sama dalam tim menelaah atau mengoreksi soal (Djemari Mardapi, 2008:94-95).

d. Melakukan Uji Coba

Sebelum soal digunakan dalam tes yang sesungguhnya, uji coba perlu dilakukan untuk semakin memperbaiki kualitas soal (Djemari Mardapi, 2008:95). Setelah dilakukan ujicoba dilakukan analisis secara kuantitatif. Analisis dilakukan berdasarkan data empiris dengan jalan ujicoba di lapangan. Analsisi kuantitatif meliputi taraf kesukaran, daya pembeda soal, reliabilitas, dan keefektifan pengecoh.

e. Memperbaiki Butir Soal

Setelah soal ditelaah secara kuantitatif, maka nantinya akan ada beberapa soal yang baik, soal yang direvisi, dan soal yang tidak baik dan harus dibuang. Soal yang perlu revisi direvisi baik dari segi bahasa yang kurang dimengerti, angka yang terlalu sulit dihitung, atau pengecoh yang tidak berfungsi dengan baik.

f. Merakit Tes

Setelah tahap revisi dilakukan, maka soal dirakit kembali. Keseluruhan butir perlu disusun secara hati-hati menjadi kesatuan soal tes yang terpadu. Dalam merakit soal, hal-hal yang dapat mempengaruhi validitas soal seperti nomor urut soal, pengelompokan bentuk soal, lay out perlu diperhatikan (Djemari Mardapi, 2008:96).

g. Melaksanakan Tes

Setelah tes dirakit langkah selanjutnya adalah melaksanakan tes. Tes yang telah disusun diberikan kepada testee untuk dikerjakan. Pelaksanaan tes dilakukan sesuai dengan waktu yang telah ditentukan (Djemari Mardapi:2008:96). Pelaksanaan tes memerlukan pantauan atau pengawasan agar dalam tes tidak terjadi kecurangan.

commit to user

Hasil tes menghasilkan data kuantitaif yang nerupa skor. Skor ini kemudian ditafsirkan menjadi nilai, yaitu rendah, menengah dan tinggi. Tinggi rendahnya nilai ini selalu dikaitkan dengan acuan penilaian (Djemari Mardapi,2008:97).

Meskipun tahap penyusunan tes seharusnya sampai tahap penafsiran hasil tes namun untuk penelitian ini setelah tahap pelaksanaan tes langkah selanjutnya adalah menganalisis hasil tes secara kuantitaif. Sehingga tes pada penalitian ini layaknya uji akhir untuk mengetahui seberapa baik instrumen yang telah disusun

5. Karakteristik Tes yang Berkualitas Baik

Untuk mengukur hasil belajar siswa, maka digunakan alat pengukuran yang benar-benar dapat mengukur kemampuan belajar siswa. Tes sebagai alat pengukur hasil belajar dikatakan baik apabila memenuhi prasyaratan tes yaitu memiliki validitas, reliabilitas, objektifitas, kepraktisan, dan ekonamis (Suharsimi Suharsimi Arikunto,2011: 57). Berikut ini adalah penjelasan untuk masing-masing persyaratan:

a. Validitas Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya (Saifuddin Azwar, 2002: 173).

Sedangkan menurut Ngalim Purwanto (1988:178) validitas adalah kualitas yang menunjukkan hubungan antara suatu pengukur/ diagnosis dengan arti/ tujuan kriteria belajar/ tingkah laku. Lebih lanjut Chalib Thoha menjelaskan bahwa, “suatu alat ukur disebut memiliki validitas bilamana alat ukur tersebut isinya layak mengukur obyek yang seharusnya diukur dan sesuai dengan kriteria tertentu, artinya ada kesesuaian antara alat ukur dengan fungsi pengukuran dan sasaran pengukuran” (1994: 110).

Validitas secara umum dibangi menjadi tiga jenis yaitu: validitas isi (contet validity), valisitas konstrak (construct validity) dan valisitas kriteria

commit to user

2008; Azwar, 2002: 175; Arikunto, 2011: 67).

1) Validitas isi Valisistas isi berkenaan dengan sejauh mana aitem-aitem mencakup keseluruhan kawasan isi yang hendak diukur. Selain harus konprehensif tes juga harus relevan dan tidak keluar dari batasan tujuan pengukuran. Pengujian validitas isi menggunakan analsisi rasional. Cara yang sering digunakan untuk menganalisis validitas tes adalah melihat apakah aitem-aitem yang ditulis sesuai dengan kisi-kisinya, yaitu telah sesuai dengan batasan domain ukur yang telah ditetapkan semula dan memeriksa apakah masing-masing aitem telah sesuai dengan indikator perilaku yang hendak diungkapkan (Saifudin Azwar, 2002: 175).

2) Validitas konstrak Validitas konstrak adalah validitas yang mengukur sejauh mana suatu tes mengukur trait atau konstrak teoritik yang hendak diukurnya. Pengujian validitas konstrak menggunakan statistika kompleks seperti analisis faktor. Salah satu prosedur pengujian validitas konstrak yang lebih sederhanan adalah multi trait multi method. Pendekatan ini menguji serentak dua atau lebih trait yang diukur melalui dua atau lebih metode. Dari prosedur tersebut nantinya akan diperoleh bukti validitas diskriminan dan validitas konvergen (Saifudin Azwar, 2002: 175-176)

3) Validitas berdasarkan kriteria Pengujian validitas kriteria dilakukan dengan cara membandingkan skor pada tes yang bersangkutan dengan skor suatu kriteria. Untuk melihat hubungan antara kedua skor dilakukan analisis korelasional. Jika tes yang digunakan untuk mengukur performasi di masa datang digunakan validitas prediktif dengan cara menganalisis koralasi antara skor tes dengan skor performasi yag hendak diprediksikan. Dalam kasus lain, ada kalanya kriteria untuk pengujian validitas tes telah tersedia.

commit to user

diperolehnya skor tes. Denagn demikian komputasi korelasi antara tes dan kriteria dapat langsung dilakuakan. Sehingga akan menghasilkan koefisien korelasi konruen (Saifudin Azwar, 2002: 176).

Sebuah tes dikatakan memiliki validitas konstruksi apabila butir- butir soal yang membangun tes tersebut mengukur setiap aspek berpikir (ingatan, pemahaman dan aplikasi) seperti yang disebutkan dalam indikator dalam tabel kisi-kisi. Validitas isi dan validitas konstruksi ini digolongkan ke dalam validitas logis atau validitas rasional (Suharsimi Arikunto, 2001).

Menurut Anas Sudijono (2005:165), upaya lain yang dapat ditempuh dalam rangka mengetahui validitas isi dan validitas konstruksi sebuah tes hasil belajar adalah dengan jalan menyelenggarakan diskusi panel. Dalam diskusi tersebut para pakar yang dipandang memiliki keahlian yang ada hubungannya dengan mata pelajaran yang diujikan, diminta pendapat dan rekomendasinya terhadap isi atau materi yang terkandung dalam tes hasil belajar yang bersangkutan.

Saifuidin Azwar menyatakan bahwa, “Dalam penyusunan dan pengembangan tes prestasi belajar, tipe validitas yang terpenting adalah validitas isi, yaitu sejaum mana aitem-aitem dalam tes memang telah sesuai untuk mengukur prestasi yang domainnya telah dibatasi secara spesifik” (2002:178). Karena alasan tersebutlah maka pada penelitian ini validitas yang digunakan adalah validitas isi. Cara yang ditempuh dengan analisis rasional yaitu apakah butir-butir dalam tes yang ditulis sesuai dengan kisi- kisi soal yang dibuat atau belum. Analisis dilakukan dengan cara mengandalkan telaah soal oleh beberapa ahli dalam bidang evaluasi pembelajaran dan ahli mata pelajaran Fisika. Cara yang dilakukan adalah dengan jalan pencocokan antara tabel spesifikasi dengan butir soal dan masing-masing butir di analisis berdasarkan pedoman analisis butir soal yang diterbitkan oleh Depdikbud.

commit to user

Reliabilitas sering

diterjemahkan sebagai kepercayaan, keterandalan, keajegan, kestabilan, dan konsisten adalah sejauh mana hasil suatu pengukuran dapat dipercaya (Suharsimi Arikunto,2011: 86). Sementara Gronlund & Lin menyatakan bahwa, “Reliability refers to the consistency of measurement that is, how consistent test scores or other assessment results are from one measurement to another ” (1995:81). Yang artinya reliabilitas atau keandalan mengacu pada konsistensi pengukuran yaitu, seberapa konsisten nilai tes atau hasil penilaian dari satu pengukuran dengan pengukuran yang lain.

Reliabilitas merupakan kriteria untuk menetapkan taraf ketelitian teknik atau alat penelitian, bila digunakan untuk mengukur hasil belajar seorang siswa. Suatu alat ukur dikatakan memiliki reliabilitas tinggi jika digunakan berulang-ulang untuk mengulang objek yang dilakukan oleh orang yang sama maupun berlainan maka akan menghasilkan hasil yang sama.

Menurut Saifudin Azwar (2002:181) ada tiga cara untuk mengestimasi reliabilitas, yaitu melalui: pendekatan tes ulang (test- retest), pendekatan tes sejajar (alternate-forms), dan pendekatan konsistensi internal (internal concistency).

1) Pendekatan tes ulang Pendekatan ini menunjukkan konsistensi pengukuran dari waktu ke waktu dan menghasilkan koefisien reliabilitas yang sering disebut sebagai koefisien stabilitas (Saifudin Azwar, 2002:181). Prosedur yang digunakan biasanya adalah dengan memberikan tes yang sama dua kali untuk kelompok yang sama dengan interval waktu antara tes, dari beberapa menit sampai beberapa tahun.

2) Pendekatan tes sejajar Pendekatan tes sejajar hanya dapat dilakukan apabila tersedia dua bentuk instrumen pengukur yang dapat dianggap memenuhi asumsi sejajar. Estimasi reliabilitas dilakukan setelah kedua instrumen dikenakan

commit to user

korelasi antara distribusi skor dari pengamatan kedua instrumen tersebut (Saifudin Azwar, 2002:182)

3) Pendekatan konsistensi internal Estimasi reliabilitas dengan pendekatan konsistensi internal di dasarkan pada data dari sekali pengenaan suatu bentuk alat ukur pada sekelompok subjek (single trial administration) (saifudin Azwar, 2002:182). Secara umum rumus untuk mengestimasi reliabilitas ini dapat digunakan rumus Koefisien Alpha. Namun, apabila pilihan jawaban butir-butir pertanyaan/ pernyataan yang ada dalam instrumen tes itu dikotomi maka dapat digunakan persamaan KR-20 (Badrun Kartowirangan, 2009:8).

c. Objektivitas Objektivitas berarti tidak adanya unsur pribadi yang mempengaruhi (Suharsimi Arikunto,2011: 60-61). Tes atau alat evaluasi dikatakan objektif bila dalam melaksanakan tes tidak ada faktor subjektif yang mempengaruhinya. Sifat subjektif ini timbul karena bentuk tes dan penilai. Tes yang berbentuk uraian akan memberi banyak kemungkinan penilai untuk bertindak subjektif. Untuk menghindari itu maka tes yang dikembangkan adalah berbentuk objektif.

d. Kepraktisan Betapapun baiknya (valid dan reliabel) suatu tes untuk mengukur prestasi siswa, tidak akan ada gunanya bila dalam pelaksanaannya dan pemberian skor diperlukan waktu yang banyak, harga mahal atau menganggu kegiatan dan kenyamanan siswa. Untuk itu tes yang dibuat harus bersifat praktis, mudah dalam administrasinya, tidak mahal, singkat, mudah dilaksanakan, mudah diberi skor, dan tidak mengganggu kegiatan lain.

commit to user

Suatu tes dikatakan ekonomis bila tes tersebut dapat digunakan dan terpakai secara memuaskan, karena tidak membutuhkan ongkos mahal, tenaga banyak, da waktu yang lama (Suharsimi Arikunto,2011: 63)

Selain kelima kriteria tersebut Aiken menambahkan bahwa “…Soal yang bermutu adalah soal yang dapat memberikan informasi setepat ‐tepatnya sesuai dengan tujuannya di antaranya dapat menentukan peserta didik mana yang sudah atau belum menguasai materi yang diajarkan guru” (Depdiknas, 2008 :1).

Untuk mendapatkan tes pilihan ganda dengan kualitas yang baik perlu dilakukan analisis butir soal. Kegiatan menganalisis butir soal merupakan suatu kegiatan yang harus dilakukan guru untuk meningkatkan mutu soal yang telah ditulis. Menurut Nitko (1996) dalam Panduan Analisis Butir Soal Depdiknas, “Analisis butir soal merupakan proses pengumpulan, peringkasan, dan penggunaan informasi dari jawaban siswa untuk membuat keputusan tentang setiap penilaian” (2008:1). Tujuan penelaahan adalah untuk mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum soal digunakan.

Aaman, Niwaz, Faize, Dahar & Alamgir menambahkan bahwa “item analysis allows us to observe the characteristic of particular item and can be ensure that question are of an appropriate standard for inclusion in test ” (2010: 62). Pernyataan tersebut dapat diartikan bahwa analisis butir soal berguna untuk mengamati karakteristik item tertentu dan dapat memastikan apakah pertanyaan yang digunakan sesuai dengan standar yang tepat untuk dimasukkan dalam pengujian.

Analisis butir soal dilaksanakan dalam dua langkah, yakni analisis secara kuantitatif dan kualitatif seperti yang diungkapkan oleh Anastasi dan Urbina yang dikutip Depdiknas (2008:1) “Dalam melaksanakan analisis butir soal, para penulis soal dapat menganalisis secara kualitatif, dalam kaitan dengan isi dan bentuknya, dan kuantitatif dalam kaitan dengan ciri ‐ ciri statistiknya.”

commit to user

Analisis secara kualitatif dilakukan oleh ahli, meliputi telaah terhadap aspek konstruksi, aspek materi dan bahasa. Penelaahan ini biasanya dilakukan sebelum soal digunakan atau diujikan. ”Dalam menganalisis butir soal secara kualitatif, penggunaan format penelaahan soal akan sangat membantu dan mempermudah prosedur pelaksanaannya.”(Depdiknas, 2008 : 4). Lebih lanjut Djemari Mardapi (2008:137) menyatakan:

Aspek materi terkait dengan substansi keilmuan yang dinyatakan serta tingkat berfikir yang terlibat. Aspek konstruksi berkaitan dengan teknik penulisan soal, baik bentuk objektif maupun non- objektif. Bentuk objektif ini biasa berupa tes pilihan dan tes uraian. Pada bidang tertentu, seperti Matematika dan Biologi, walaupun digunakan bentuk uraian namun apabila jawabannya hanya satu,maka disebut dengan uraian objektif. Aspek bahasa terkait dengan kekomunikatifan/kejelasan halyang ditanyakan.”

Untuk lebih memudahkan dalam penelaahan soal secara kualitatif, maka digunakan tabel. Format tabel penelaahan kualitatif butir soal pilihan ganda dapat dilihat pada Lampiran 2. Untuk aspek materi terdapat empat hal yang ditelaah. Empat hal tersebut adalah : (1) Soal sesuai indikator (menuntut tes tertulis untuk bentuk pilihan ganda). (2) Materi yang ditanyakan sesuai dengan kompetensi (urgensi, relevansi, kontinuitas, keterpakaian sehari-hari tinggi). (3) Pilihan jawaban homogen dan logis dan

4) Hanya ada satu kunci jawaban. Dari segi konstruksi, penulisan soal pilihan ganda harus memperhatikan beberapa hal berikut ini : (1) Pokok soal dirumuskan dengan singkat, jelas dan tegas. (2) Rumusan pokok soal dan pilihan jawaban merupakan pernyataan yang diperlukan saja. (3) Pokok soal tidak memberi petunjuk kunci jawaban. (4) Pokok soal bebas dari pernyataan yang bersifat negatif ganda. (5) Pilihan jawaban homogen dan logis ditinjau dari segi materi. (6) Gambar, grafik, tabel, diagram dan sejenisnya yang terdapat pada soal harus jelas dan berfungsi. (7) Panjang pilihan jawaban harus relatif sama. (8) Pilihan jawaban tidak menggunakan pernyataan “semua jawaban

commit to user

angka atau waktu disusun berdasarkan urutan besar kecilnya nilai angka atau kronologisnya. Dan (10) Butir soal tidak bergantung pada jawaban soal sebelumnya.

Ditinjau dari segi bahasa, penulisan soal pilihan ganda harus memperhatikan beberapa hal berikut ini : (1) Menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia. (2) Menggunakan bahasa yang komunikatif. (3) Tidak menggunakan bahasa yang berlaku setempat. (4) Pilihan jawaban tidak mengulang kata/ kelompok kata yang sama kecuali merupakan satu kesatuan pengertian.

Analisis secara kualitatif berhubungan dengan validitas. Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya. Tes yang mempunyai validitas yang tinggi mampu memberikan hasil ukur yang tepat dan akurat sesuai dengan maksud pelaksanaan tes tersebut (Saifudin Azwar, 2002: 173-174)

Djemari Mardapi (2008: 16) menyatakan “Validitas merupakan dukungan bukti dan teori terhadap penafsiran skor tes sesuai dengan tujuan penggunaan tes. Oleh karena itu, validitas merupakan fundamen paling dasar dalam mengembangkan dan mengevaluasi butir tes.” Djemari Mardapi (2008:18) melanjutkan “ Sejauh mana suatu tes memiliki bukti validitas ini ditetapkan menurut analisis rasional terhadap isi tes, yang penilaiannya didasarkan atas petimbangan subjektif individual. Walaupun subjektif, namun yang terlibat adalah beberapa pakar pada bidang yang diukur dalam suatu forum diskusi sehingga hasilnya dapat dipertanggungjawabkan.”

b. Analisis Secara Kuantitaif

Analisis dilakukan dengan menggunakan dua pendekatan yairu dengan pendekatan teori tes klasik dan pendekatan teori tes modern atau teori respon butir. Dalam penelitian ini analisis butir yang dilakukan dengan pendekatan teori klasik.

commit to user

mendekatan teori tes klasik menghasilkan karakteristik yang meliputi: kesukaran (p), daya pembeda (d), dan keefektifan distraktor. Selain itu dapat pula diketahui reliabilitas soal tes dan kesalahan baku pengukuran. Analisis taraf kesukaran, daya beda dan keefektifan distraktor dilakukan melalui analisis tiap butir soal, sedangkan reliabilitas dan kesalahan pengukuran baku dilihat dengan cara analisis tes secara keseluruhan (2009:13)

1) Reliabilitas

Analisis ini untuk mengetahui tingkat kepercayaan. Suatu tes dapat dikatakan mempunyai tingkat kepercayaan yang tinggi bila hasil tes tersebut memberikan hasil yang tetap. Pendekatan yang digunakan dalam penelitian ini adalah pendekatan konsistensi internal artinya didasarkan pada data dari sekali penggunaan satu bentuk alat ukur pada sekelompok subjek, atau untuk mengetahui keajegan instrumen, artinya jika dilakukan pengukuran ulang dengan instrumen tersebut maka seandainya hasilnya berubah, perubahan itu dianggap tak berarti.

Tenik analisis reliabilitas yang digunakan dalam penelitia ini adalah teknik formula Kuder-Richardson-20 atau KR-20, karena penskoran tes Fisika yang dikembangkan berbentuk dikotomi. Untuk mengetahui reliabilitas butir soal menggunakan rumus alpha KR-20 adalah sebagai berikut:

(Depdiknas, 2008:18) di mana :

KR-20 = reliabilitas tes secara keseluruhan p

= proporsi subjek yang menjawab item benar

= banyak item

SD

= Standar deviasi dari tes

commit to user

Bermutu atau tidaknya butir-butir item tes hasil belajar pertama- tama dapat diketahui dari derajad kesukaran atau taraf kesulitan yang dimiliki oleh masing-masing butir item tersebut. Butir-butir tes hasil belajar dapat dinyatakan sebagai butir-butir item yang baik, apabila butir- butir item tersebut tidak terlalu sukar dan tidak pula terlalu mudah dengan kata lain derajat kesukaran item itu adalah sedang atau cukup.

Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam indeks. Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam bentuk proporsi yang besarnya berkisar 0,00-1,00 Aiken(1994:66). Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil hitungan, berarti semakin mudah soal itu. Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal.Pada prinsipnya,skor rata-rata yang diperoleh peserta didik pada butir soal yang bersangkutan dinamakan tingkat kesukaran butir soal. Rumus yang digunakan untuk menghitung indeks kesukaran soal, yaitu:

Tingkat Kesukaran( P) = jumlah siswa yang menjawab benar butir soal jumlah siswa yang mengikuti tes

(Depdiknas, 2008:12)

3) Daya Beda (D)

Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara warga belajar/siswa yang tidak/kurang/belum menguasai materi yang ditanyakan. “A highly discriminating item indicates that the student who had high test score got the item correct whereas student who had low test scores got the item incorrect ” (Zaman, et al, 2010: 62). Yang artinya sebuah item dengan indeks daya beda tinggi menunjukkan bahwa siswa yang memiliki nilai ujian tinggi mampu menjawab aitem tersebut dengan benar sedangkan siswa yang memiliki nilai ujian yang rendah menjawab salah aitem tersebut. Terdapat

commit to user

yaitu:

Atau = (

(Depdiknas, 2008:12) di mana:

D : daya pembeda soal BA : jumlah jawaban benar pada kelompok atas BB : jumlah jawaban benar pada kelompok bawah N : jumlah siswa yang mengerjakan soal

Untuk mengetahui daya pembeda soal bentuk pilihan ganda dapat dipergunakan rumus korelasi point biserial (r pbis ) dan korelasi biserial (r bis ). Secara matematis nilainya dinyatakan dengan:

(Nonoh Siti Aminah, 2012: 9)

Dan nilai korelasi biserial dinyatakan dengan persamaan

(Nonoh Siti Aminah, 2012: 9) keterangan:

p : proporsi testee yang menjawab benar pada item soal q : Proporsi testee yang menjawab salah pada item soal (1 – p) Mp : mean skor tes dari peserta tes yang menjawab benar Mt : mean skor total

s : varians total T y : ordinat p dalam distribusi normal Nilai korelasi point biserial selalu lebih rendah daripada nilai korelasi

biserial . hubungan antara keduanya dinyatakan:

(Nonoh Siti Aminah, 2012: 9)

4) Keefektifan Pengecoh

Alternatif jawaban yang merupakan pengecoh (distraktor) yang baik harus memiliki koefisien korelasi yang negatif dan tinggi (Saifudin

commit to user

(distraktor) dipilih oleh siswa dari kelompok bawah di samping itu Fernandes (1984) menyimpulkan pengecoh dapat berfungsi baik jika paling sedikit dipilih oleh 2% peserta tes (Elvin Yusliana Ekawati, 2010:336).

Dalam analisis menggunakan program ITEMAN daya beda pilihan jawaban ditunjukkan oleh prop endorsing atau proporsi pemilih jawaban dan nilai alternative biser dimana distraktor dikatakan baik jika prop endorsing bernilai lebih dari 0,02 atau minimal dipilih oleh 2% testee serta alternative biser bernilai negatif tinggi.

Keputusan suatu item soal layak digunakan, perlu direvisi atau ditolak didasarkan pada kriteria keputusan untuk penilaian item soal oleh Elvin Yusliana Ekawati (2010) sebagai berikut

1) Item soal diterima, apabila karakteristik item soal memenuhi semua kriteria. Item soal yang terlalu sukar atau mudah, tetapi memiliki daya beda dan sistribusi pengecoh item yang memenuhi kriteria, butir soal tersebut dapat diterima atau dipilih.

2) Item soal direvisi, apabila salah satu atau lebih dari ketiga kriteria karakteristik item soal tidak diterima.

3) Item soal ditolak, jika item soal memiliki karakteristik yang tidak memenuhi semua kriteria (2010:336).