Rancangan dan Susunan Tes

Rancangan dan Susunan Tes

Tujuan
Mendeskripsikan isu yang perlu dipertimbangkan
ketika merencanakan tes.
 Mendeskripsikan jenis tujuan pendidikan yang
relevan untuk mengorganisasikan item tes
(taksonomi tujuan kognitif).
 Mendeskripsikan pertimbangan perilaku dan isi
ketika mempersiapkan item tes (daftar spesifkasi).
 Mengetahui keunggulan dan kekurangan item
respon terseleksi versus tersusun (selected versus
constructed response item) dan terbiasa dengan
tipe item tes berikut ini : benar-salah,
mencocokkan, pilihan ganda, Likert, jawaban
pendek, esai, bercerita.


Mengetahui hal-hal yang perlu
dipertimbangkan ketika
mengumpulkan dan

memproduksi tes.
 Mendeskripsikan keunggulan dan
kekurangan pengetahuan lisan.
 Memahami strategi pengetesan
pencapaian prestasi
(achievement testing strategy).




Menyiapkan tes karakteristik minat dan kepribadian
secara tertulis melibatkan banyak masalah yang
berbeda daripada menyusun tes pencapaian prestasi
atau kecakapan alami (test of achievement atau
aptitude).



Sebagian besar guru tidak terbiasa dengan prosedur
kompleks yang diikuti oleh para perancang tes

professional.



Apapun jenis tes ataupun tujuan para pemakai tes,
perencanaan isi diperlukan sebelum item yang ada
dalam tes ditulis.



Perencanaan tes meliputi defnisi variable yang jelas
atau susunan yang harus diukur, deskripsi orang yang
harus diteliti, kondisi pengelolaan tes dan informasi
berkenaan dengan pemberian skor, interpretasi skor
dan cara penggunaan hasil tes.

Merencanakan Tes
Tes Penyaringan



Menyusun tes kecakapan alami (aptitude test) untuk
menyaring para pelamar pekerjaan tertentu dimulai
dengan menganalisis secara mendetail aktivitas yang
berisi pekerjaan.



Analisis tugas atau analisis pekerjaan (job analysis)
terdiri dari menentukan komponen pekerjaan sehingga
situasi atau item tes dapat direncanakan untuk
memprediksi kinerja karyawan.



Spesifkasi meliputi insiden kritis (critical incident) –
perilaku yang sangat menentukan kinerja yang berhasil
atau tidak berhasil dan informasi lain yang sangat
mendeskripsikan aktivitas pekerjaan.

Tes Kecerdasan

 Seperti dalam menyusun tes lain,
sekumpulan item barangkali mengukur aspek
susunan “kecerdasan” dikumpulkan.


Item ini akan disusun menurut teori perilaku
kecerdasan spesifk atau hanya dengan
referensi sejenis tugas yang dapat dikerjakan
secara lebih efektif oleh orang dengan
kecerdasan sangat tinggi daripada orang
dengan kecerdasan rendah.



Pemilihan item untuk tes akhir akan dibuat
berdasarkan hubungan antara respon item
terhadap kriteria seperti usia kronologis dan
hubungan diantara item tes itu sendiri.

Skala dan Daftar Rinci Kepribadian



Berbagai pendekatan, beberapa berdasarkan
pada akal sehat (atau pendidikan) yang lain
pada teori kepribadian dan yang lain lagi pada
prosedur statistik digunakan dalam menyusun
daftar rinci kepribadian dan skala peringkat.



Banyak instrument pemeriksaan kepribadian
yang dipublikasikan telah disusun dengan
mengkombinasikan pendekatan teoritis,
rasional dan empiris. Salah satu atau lebih
pendekatan ini digunakan pada tahap
perkembangan instrument yang berbeda.

Tes Pencapaian Prestasi
(Achievement Test)
Lebih banyak perhatian ditujukan pada prosedur untuk

menyusun tes pencapaian prestasi skolastik daripada tes
jenis lain.
 Tes pencapaian prestasi lebih dikelola daripada semua jenis
tes lain yang dikumpulkan.


Siswa lebih banyak belajar dan mengingat ketika mereka
lebih sering dites.
 Hasil tes tidak terbatas pada mengevaluasi dan memotivasi
siswa. Hasil ini juga memberikan informasi bagi guru,
administrator sekolah dan orang tua yang memperhatikan
tingkat tujuan pendidikan yang akan dicapai.




Dengan menghasilkan data yang berkaitan dengan efektiftas
kurikulum sekolah dan prosedur pengajaran, skor tes
menyumbang pada perencanaan pengajaran bagi individu
siswa atau seluruh kelas dan sekolah.


Pertanyaan Bagi Perencana Tes
Perhatian seksama pada pertanyaan
berikut ini :
 Pada topik dan materi apa siswa akan
dites ?
 Apa jenis pertanyaan yang harus
disusun ?
 Apa item dan format atau lay-out tes
yang harus digunakan ?
 Kapan, di mana dan bagaimana tes
harus dikelola ?
 Bagaimana lembar jawab tes akan
diskor dan dievaluasi ?

Taksonomi Tujuan Kognitif


Tujuan taksonomi ini tidak hanya
menyusun item untuk mengukur memori

hafalan sederhana dan merencanakan
item untuk memeriksa pencapaian
tujuan pendidikan berkualitas tinggi yang
mengharuskan pendalaman materi.



Item berikut ini, yang dapat diberikan
pada format tes obyektif atau esai
menggambarkan taksonomi yang
dideskripsikan pada Tabel 2.1

Apa rumus untuk menghitung standard error
pengukuran ? (Pengetahuan)
 Perhatikan grafk berikut ini dan tentukan berapa item
harus ditambahkan pada tes 50 item untuk
meningkatkan reliabilitas dari 0,60 ke 0,80
(Pemahaman menyeluruh)
 Hitunglah standard error estimasi untuk tes yang
memiliki korelasi 0,70 dengan kriteria yang memiliki

standard deviasi 10 . (Penerapan)
 Bedakan antara tes pencapaian prestasi kelas
(classroom achievement test) dengan tes pencapaian
prestasi standard (standardized achievement test)
mengenai apa yang diukur oleh setiap tes dan
bagaimana tes ini digunakan (Analisis)
 Rumuskan teori yang mengkaitkan antara minat dan
kepribadian dan kutiplah bukti penelitian yang sangat
mendukung (Sintesis)
 Evaluasi kritik berkaitan dengan Isi dan penggunaan
SAT. (Evaluasi)


Tabel 2.1 Kategori dari Taksonomi of
Educational Objectives : The Cognitive Domain

Pengetahuan
 Pengetahuan meliputi pengingatan
kembali fakta yang dipelajari sebelumnya.



Sampel kata kerja pada item pengetahuan
meliputi mendefnisikan, mengidentifkasi,
menyusun daftar dan menyebutkan.



Sampel item pengetahuan berupa : “Tulis 6
kategori utama dalam Taxonomy of
Education Objectives : The Cognitive
Domain”.

Pemahaman


Pemahaman menyeluruh berarti
memahami maksud atau tujuan sesuatu.




Sampel kata kerja dalam item
pemahaman menyeluruh ini meliputi
mengubah, menjelaskan dan meringkas.



Sampel item pemahaman menyeluruh ini
berupa “Jelaskan apa yang dimaksud
oleh peninjau ulang tes ketika ia berkata
bahwa tes tidak dapat diandalkan”.

Penerapan


Penerapan meliputi penggunaan
informasi dan ide pada situasi khusus.



Sampel kata kerja pada item penerapan
meliputi menghitung, menentukan,
memcahkan masalah.



Sampel item penerapan adalah “
Hitunglah hasil rata-rata (mean) dan
standard deviasi kelompok skor berikut
ini”.

Analisis


Analisis berarti memecahkan sesuatu
untuk mengungkapkan struktur dan
hubungan antar-bagian.



Sampel kata kerja pada item analisis
terdiri dari menganalisis, membedakan
dan menghubungkan.



Sampel item analisis adalah “
Analisislah unit pengajaran ini ke dalam
beberapa kategori perilaku dan isi”

Sintesis


Sintesis adalah mengkombinasikan
berbagai elemen atau bagian menjadi
utuh secara struktural.



Sampel kata kerja pada item sintesis
ini antara lain merancang, memikirkan,
merumuskan dan merencanakan.



Sampel
item
sintesis
adalah

Rancanglah tabel spesifkasi untuk tes
mengenai statistika dasar”.

Evaluasi


Evaluasi adalah membuat penilaian
berdasarkan penalaran.



Sampel kata kerja pada item evaluasi
antara lain membandingkan ,
mengkritik, mengevaluasi dan menilai.



Sampel item evaluasi berupa
“Evaluasilah prosedur yang digunakan
dalam membuat standard pada tes ini”.

Tabel Spesifkasi


Sebagian besar perancang tes tidak
memegang teguh taksonomi formal dalam
membuat spesifkasi tujuan yang akan
diukur.



Lebih mudah menyusun item yang menilai
istilah dan fakta pengetahuan daripada
item yang mengukur kemampuan untuk
menganalisis dan mengevaluasi tetapi
item di kategori di 2 kategori terakhir
harus juga dimasukkan ke dalam tes.

Menyiapkan item tes


Tujuan utama perencanaan tes adalah persiapan outline
mendetail seperti tabel spesifkasi yang berfungsi sebagai
pedoman dalam menyusun item untuk menilai atau memprediksi
tujuan tertentu.



Untuk tes obyektif, biasanya direkomendasi bahwa sekitar 20 %
lebih item yang sesungguhnya diperlukan harus dipersiapkan
lebih awal sehingga jumlah memadai dari item yang bagus
tersedia untuk versi terakhir tes.



Organisasi tes komersial, semacam Educational Testing Service
mempekerjakan penulis item yang memiliki pemahaman pokok
bahasan tes dan ketrampilan item tes.



Seseorang yang ingin belajar mengenai cara menyusun item tes
yang baik dapat mengambil keuntungan dengan meneliti
sampel yang terdapat pada tes publikasi karena item tes ini
tersedia dengan baik.



Berbagai metode pengelompokan item menurut
respons yang diminta telah diungkapkan.



Dua kategori utama berupa format respons-dipilih
(selected-response format) dan format responsdisusun (constructed-response format), mengharuskan
peserta tes menyeleksi respons mereka dari berbagai
respons yang telah diberikan. Ini juga merujuk pada
format forced-choice (pilihan terpaksa) dan meliputi
item pilihan ganda dan benar-salah.



Pada tes pencapaian prestasi (achievement test),
peserta tes harus mengidentifkasi atau mengenali
jawaban yang tepat.



Pada tes kepribadian, peserta tes biasanya menjawab
item menurut alternatif mana yang paling
mendeskripsikan mereka.



Constructed-response item mengharuskan peserta
tes untuk menciptakan dan mengorganisasi
respons (juga disebut item bebas merespon/freeresponse).



Dalam tes kepribadian yang meminta partisipan
untuk bercerita mengenai gambar tertentu atau
merespon noda karena terkena tinta. Dalam tes
pencapaian prestasi kelas, perbedaan ini seringkali
terjadi antara tes obyektif (item respons-terpilih)
dan tes esai (item respons-tersusun).



Salah satu perbedaannya ialah item obyektif dapat
menjadi jenis dipilih atau disusun, tergantung pada
apakah peserta ujian diminta untuk menyusun
respons atau memilih jawaban paling benar dari
daftar alternatif.



Sistem pemberian skor dapat dirancang
untuk pertanyaan esai, jadi mengubah item
obyektif bisa terjadi. Ini terjadi misalnya
hanya dengan memberikan poin skor jika
frase perancangan terjadi pada respons
esai.



Tes pencapaian prestasi biasanya menilai
respons yang diberikan oleh peserta tes
baik benar atau salah. Dalam beberapa
kasus, poin bonus ditambahkan pada
respons yang unggul. Hal ini kadangkala
terjadi pada tes kecerdasan yang dikelola
secara individu yang partisipan diberi poin
tambahan karena merespons lebih cepat.



Sistem pemberian skor dapat dirancang
untuk pertanyaan esai, jadi mengubah item
obyektif bisa terjadi. Ini terjadi misalnya
hanya dengan memberikan poin skor jika
frase perancangan terjadi pada respons
esai.



Tes pencapaian prestasi biasanya menilai
respons yang diberikan oleh peserta tes
baik benar atau salah. Dalam beberapa
kasus, poin bonus ditambahkan pada
respons yang unggul. Hal ini kadangkala
terjadi pada tes kecerdasan yang dikelola
secara individu yang partisipan diberi poin
tambahan karena merespons lebih cepat.



Tetapi tes kepribadian tidak memiliki jawaban
benar atau salah tetapi pemberian skor tinggi
akar diberikan pada sikap yang sangat kuat.



Item objektif tidak terbatas pada empat
format tradisional (benar-salah,
mencocokkan, pilihan ganda dan Likert),
tetapi format tersebut paling popular.



Salah satu keunggulan dari pilihan ganda
adalah bahwa format ini dapat diberi skor
dengan mudah dan objektif. Karena setiap
item mebutuhkan lebih sedikit waktu untuk
menjawab daripada tes esai, sampel isi yang
lebih luas termasuk dalam tes objektif.

 Item

Benar-Salah. Salah satu jenis item yang disusun
paling sederhana tetapi paling banyak dikritik oleh
tester professional adalah item benar-salah.

 Item

ini seringkali berkaitan dengan informasi sepele
atau disusun dengan menghilangkan pernyataan
harfah dari buku teks.

 Item

ini sering ambigu dan tidak dapat digunakan
untuk mengukur tujuan pengajaran yang lebih
kompleks.

 Juga

karena skor total pada tes benar-salah dapat
dipengaruhi oleh kecenderungan peserta tes benarsalah dapat dipengaruhi oleh kecenderungan peserta
tes menebak ketika merasa ragu-ragu atau setuju
(atau tidak setuju) sehingga ketepatan skor
dipertanyakan.



Dengan mengesampingkan kekurangan ini,
item benar-salah tidak harus menjadi sepele
atau ambigu dan konsekuensinya
pembelajaran salah arah.



Dalam mempertahankan item benar-salah,
Ebel (1979) menyatakan bahwa “tingkat
perintah siswa pada bidang pengetahuan
tertentu ditunjukkan dengan kesuksesan
mereka dalam menilai kebenaran atau
kesalahan dalil yang berhubungan”, Ebel
menganggap dalil (proposition) seperti itu
menjadi ekspresi pengetahuan verbal yang
dipandang sebagai intisari pencapaian
prestasi pendidikan.

Apapun tujuan item benar-salah, dalam
menyusun item jenis ini, disarankan
untuk mengikuti anjuran berikut ini :
 Pastikan bahwa pertanyaan
berhubungan dengan masalah penting
(bukan sepele).
 Buatlah pertanyaan relatif pendek dan
secara tidak memenuhi syarat benar
atau salah.
 Hindari item yang dinyatakan secara
negative, terutama yang mengandung
dobel negatif.
 Hindari item ambigu dan menjebak.

 Sebagai

peraturan, hindari kata penentu (determiner)
khusus. Jika determiner khusus digunakan untuk
mengandung peserta tes yang harus tidak
berpengetahuan tetapi layak ikut tes (testwise),
determiners tersebut harus dimasukkan ke dalam
pernyataan benar sesering pernyataan salah.
 Pada pernyataan pendapat, kutiplah sumber atau pihak
berwenang.
 Buatlah pernyataan benar kira-kira setara dengan
panjang yang sama dan buatlah jumlah pernyataan
benar kira-kira setara dengan jumlah yang salah.
Karena item salah cenderung lebih diskriminasi
daripada item benar, dapat disarankan bahwa jumlah
pernyataan salah seharusnya lebih banyak dari pada
jumlah pernyataan benar.
Namun, jika guru mengikuti praktik ini pada tes yang
dilaksanakan berturut-turut, siswa menyadari jenis tes
ini dan mulai menjawab salah ketika merasa ragu-ragu
tentang jawaban.



Buatlah jawaban salah lebih
menarik dengan membuat
susunan kata dalam item dengan
cara tertentu sehingga logika
superfcial, miskonsepsi popular
atau determiner khusus
menyatakan bahwa jawaban salah
adalah benar.
Pernyataan salah yang memiliki
lingkaran kebenaran mungkin juga
menyandung peserta tes yang
tidak berpengetahuan.

Item mencocokkan.


Item benar-salah maupun pilihan ganda merupakan
variasi dari item mencocokkan. Pada ketiga jenis
item ini, serangkaian opsi respons dicocokkan
dengan serangkaian opsi stimulus (premis).



Pada item mencocokkan memiliki premis majemuk
dan opsi majemuk. Tugas peserta tes pada item
mencocokkan ini memasangkan opsi respon dengan
premis yang tepat.



Mencocokkan biasanya satu ke satu (satu respons
per premis) tetapi akan lebih baik satu ke banyak,
banyak ke satu atau banyak ke banyak. Peserta tes
tentu saja harus diberitahu prosedur mana yang
diterapkan pada item tertentu.

Pedoman untuk menyusun item mencocokkan :
 Susun premis dan opsi respons ke dalam format
kolom yang jelas dan logis, premis di kolom kiri
dan opsi di kolom kanan.
 Gunakan 6-15 premis dengan 2 atau 3 lebih
banyak opsi respons daripada premis.
 Urutkan nomor premis dari nomor kecil dan
tempatkan huruf di depan opsi respons.
 Tentukan dengan jelas dasar untuk mencocokkan.
 Tempatkan seluruh item dalam satu halaman.


Jenis item mencocokkan khusus berupa item
menyusun kembali (rearrangement item) yang
mengharuskan peserta tes menyusun kelompok
opsi ke dalam urutan kategori yang sudah
ditentukan sebelumnya.

Item Pilihan Ganda


Tidak ada seorang pun yang tahu siapa penyusun
item tes pilihan ganda yang pertama tetapi dari sudut
pandang pemeriksaan psikologi, penyusunan ini
merupakan peristiwa menguntungkan. Item pilihan
ganda merupakan item tem obyektif yang paling
serbaguna karena dapat digunakan untuk mengukur
tujuan pembelajaran yang sederhana maupun
kompleks pada setiap tingkat kelas dan semua pokok
masalah.



Skor pada item pilihan ganda juga kurang
dipengaruhi menebak dan kumpulan respons lain
daripada skor pada item objektif lain. Informasi
diagnostik yang bermanfaat dapat diperoleh dari
analisis opsi tidak benar (distracter) yang dipilih oleh
peserta tes.

Kelemahan item pilihan ganda meliputi :
 Item yang baik sulit disusun, terutama item yang
semua opsinya sama menariknya bagi para
peserta tes yang tidak mengetahui jawaban benar.
 Item menekankan pada pengenalan (recognition)
bukan pada daya ingat dan pengorganisasian
informasi
 Item membutuhkan lebih banyak waktu menjawab
dan item ini mengambil sampel domain pokok
bahasan lebih sedikit daripada item benar-salah.
Item juga mendukung pembelajaran hafalan yang
mendetail, bukannya memahami materi dengan
cara lebih bermakna dan mendalam.
 Para perancang tes biasanya lebih sulit menyusun
item untuk mengukur pemahaman dan pemikiran
daripada item yang mengukur langsung
pengetahuan pokok masalah.

Cara lain yang membuat keputusan
peserta lebih menuntut adalah :
 Meliputi item dengan berbagai jawaban
yang jumlah opsi variabelnya benar dan
peserta tes harus mengidentifkasi opsi
mana (jika ada) benar atau salah
 Meminta peserta tes memilih jawaban
dan mengembangkan atau menulis
pembenaran jawaban itu
 Meminta peserta tes mengidentifkasi
susunan yang tepat (seperti persamaan
atau metode penyelesaian) pada tugas
memecahkan masalah.

Format Likert
 Format Likert lazimnya terdiri dari item 5poin berkisar pada rangkaian dari sangat
setuju sampai sangat tidak setuju.


Namun, format ini dapat pula memiliki tiga
atau empat pilihan atau bahkan lebih dari
5 pilihan. Variasinya merupakan skala
peringkat grafk atau analog visual (visual
analogue or graphic rating scale) yakni
bermusuhan ….. ramah).



Format ini jelas lebih tepat untuk
mengukur sikap dan kepribadian, bukan
pencapaian.

Format Respons-disusun
 Fitur inti format respons adalah bahwa format
ini mengharuskan peserta tes menciptakan
atau mengkontraskan respons. Variasi yang
relatif terstruktur berupa teknik mengisi titiktitik (fll in the blank) yang digunakan untuk
item jawaban pendek. Metode yang jauh lebih
pendek mengharuskan peserta tes
memasukkan portofolio kerja seseorang atau
meminta keluarga atau pelamar kerja
memecahkan problem simulasi.


Format respons-disusun paling umum berupa
teknik item jawaban pendek, esai dan
bercerita.

Item Jawaban-Pendek
 Peserta tes diminta untuk melengkapi atau
mengisi satu atau lebih tempat kosong
dengan kata frase yang benar atau
jawaban singkat pada pertanyaan.
 
 Meskipun format ini pasti bermanfaat untuk
menilai pengetahuan atau terminology,
item jawaban pendek memiliki
keterbatasan serius; format ini tidak tepat
untuk pengukuran tujuan pengajaran yang
kompleks dan karena mungkin ada lebih
dari satu jawaban benar, pemberian skor
secara keseluruhan tidak selalu objektif.

Pedoman berikut ini harus diikuti dalam
menyusun item jawaban-pendek :
 Pertanyaan langsung lebih disukai daripada
pertanyaan tidak lengkap.
 Buatlah frase/susunan beberapa kata pada
item dalam cara tertentu sehingga jawabannya
pendek dan tidak ambigu.
 Jika pertanyaan tidak lengkap digunakan,
tempatkan tempat kosong pada bagian akhir
pernyataan.
 Buatlah semua bagian kosong sama panjang.
 Hindari banyak bagian kosong pada item sama,
terutama jika bagian kosong tersebut membuat
makna tugas menjadi tidak jelas.
 Tunjukkan unit yang harus diisi dengan
jawaban angka.

Item Tes Esai
 Keunggulan terpenting item esai adalah bahwa item ini
dapat mengukur kemampuan mengorganisasi, mengaitkan
dan berkomunikasi. Perilaku ini tidak dapat dengan mudah
dinilai dengan item objektif.


Tes esai memiliki keunggulan tambahan yakni dengan hanya
membutuhkan waktu lebih sedikit untuk menyusun dan
dengan mengurangi kemungkinan bahwa peserta tes akan
mendapatkan item benar hanya dengan menebak.



Namun, pertanyaan esai begitu umum sehingga peserta tes
yang berbeda akan menginterpretasikan pertanyaan dengan
sangat berbeda. Pemberian skor jawaban juga
mengakibatkan perbedaan interpretasi mengenai jawaban
terbaik. Juga, hanya sekitar enam pertanyaan esai dapat
dijawab dengan periode waktu di kelas 50 menit.



Hal ini tidak cukup untuk menentukan semua cakupan
pengetahuan seseorang tentang masalah pokok.



Kelemahan tes esai lainnya adalah
bahwa tes ini peka terhadap tipuan
peserta tes yang terampil bicara
tetapi tidak diberitahu sebelumnya
dan pemberian skor pada tes ini
subjektif dan menghabiskan banyak
waktu.

Dalam merancang pertanyaan esai, penulis
item akan mencoba membuat pertanyaan
seobyektif mungkin. Hal ini dapat dilakukan
dengan :
 Mendefnisikan tugas dan menyusun kata
dalam item dengan jelas, misalnya minta
peserta tes untuk “mengkontraskan” dan
“menjelaskan” bukan mendiskusikan.
 Menggunakan angka kecil untuk item,
semua harus dicoba oleh semua peserta tes
 Menyusun item sehingga para ahli masalah
pokok setuju bahwa satu jawaban dapat
dibuktikan lebih baik dari yang lain
 Meminta para peserta tes menjawab setiap
item pada lembar kertas terpisah.

Teknik Bercerita


Salah satu metode yang diklaim mampu
mendeteksi pola kepribadian ialah
meminta orang untuk bercerita.



Secara umum, peserta tes diperlihatkan
pada gambar dan diminta mengatakan
apa yang dilakukan orang dalam
gambar, apa yang mereka piker dan
rasakan, peristiwa apa yang
menyebabkan gambar dan apa hasilnya.

Menggunakan Komputer dalam
Penyusunan Tes


Penerapan komputer paling umum dalam
penyusunan tes terdiri dari program
pemrosesan kata untuk membantu mengetik
item, memformat, mengecek kesalahan ejaan
dan sintaksis dan lain sebagainya.



Para penulis item-tes berbasis komputer,
algoritma spesifkasi domain untuk
menghasilkan item tes dan pendekatan
berbasis linguistic atau pembelajaran konsep
untuk menulis item memberikan prosedur
yang lebih efsien dan akurat dalam
penyusunan item tes.

Merakit dan mereproduksi tes


Setelah item tes dipersiapkan, disarankan
untuk ditinjau ulang dan diedit oleh
beberapa orang lain yang berpengetahuan.
Bahkan upaya paling menyakitkan tidak
selalu menghasilkan tes yang bagus.



Di kelas, tes pencapaian prestasi
(achievement test) yang dibuat sendiri
dapat ditingkatkan oleh teman atau rekan
yang sering mengetahui letak kesalahan
dan memberikan saran berharga untuk
meningkatkan item.

Dengan asumsi bahwa para perancang tes telah
menyusun sejumlah item memuaskan,
keputusan akhir berkaitan dengan beberapa
masalah harus dibuat sebelum menerapkan tes.







Apakah panjang tes sesuai dengan batas waktu ?
Bagaimana cara item dikelompokkan atau
disusun di halaman buklet tes ?
Apakah jawaban ditandai pada buklet tes atau
apa lembar jawaban khusus yang akan
digunakan ?
Bagaimana cara memproduksi buklet tes dan
lembar jawaban ?
Informasi apa yang harus dimasukkan pada
petunjuk tes ?

Panjang Tes
 Berapa

banyak item yang terdapat pada tes tergantung
pada batas waktu, tingkat membaca peserta tes dan
panjang serta kesulitan item. Item lebih pendek dan /atau
item yang hanya membutuhkan memori hafalan fakta
dapat dijawab dengan sedikit waktu daripada item panjang
yang membutuhkan penghitungan yang menghabiskan
energy dan/atau pemberian alas an abstrak.

 Tes

pilihan ganda atau jawaban pendek 50 item dan tes
benar salah 100 item biasanya sesuai untuk periode kelas
50 menit pada tingkat SMP atau SMA.

 Lima

atau enam pertanyaan esai yang mengharuskan
jawaban setengah halaman dapat dikerjakan dengan
waktu yang sama. Kecuali jika itemnya sangat panjang dan
sangat sulit, setidaknya 90% siswa di kelas pada sekolah
menengah akan dapat menyelesaikan tes dengan waktu
yang diberikan.

Susunan item
 Disarankan untuk menyusun pola item pilihan
ganda dan item benar salah sehingga
jawaban tidak mengikuti pola.
Lembar Jawab
 Pada sebagian besar tes kelas, terutama kelas
bawah disarankan agar para siswa menandai
atau menulis jawaban di buklet tes. Ini
mengurangi kesalahan dalam merespons.
 Pada tes obyektif, meminta peserta tes untuk
menulis huruf atau jawaban yang tepat di
bagian tepi yang kosong di sebelah kiri
pertanyaan juga memudahkan pemberian
skor.

Setiap institusi pendidikan memiliki
fasilitas mereproduksi materi tertulis
atau cetak untuk penggunaan di kelas.
 Mesin fotokopi dapat digunakan untuk
menggandakan buklet tes dalam
format cetak satu atau 2 sisi, kadangkadang berwarna.




Jika tipe lembar jawab sama
digunakan untuk tes berbeda, jumlah
yang sama banyak dapat dicetak pada
sekali putar mesin dan disimpan untuk
administrasi tes lain.

Petunjuk tes


Petunjuk tes esai atau objektif yang dikelola
secara serempak pada sekelompok orang
ditempatkan di bagian depan tes dan
petunjuk khusus untuk setiap bagian tes
multibagian diletakkan sebelum masingmasing bagian.



Biasanya cukup bijaksana untuk mengetik
petunjuk dengan jenis huruf tebal sehingga
para peserta tes tidak akan melompat atau
mengabaikannya. Karena susunan kata untuk
petunjuk itu berdampak pada skor perolehan
maka petunjuk itu harus tepat bukannya
umum.



Petunjuk dapat disampaikan secara
lisan, bentuk cetak atau keduanya,
petunjuk harus menginformasikan
para peserta tes tentang tujuan tes
(atau item), bagaimana respons harus
diindikasikan, bantuan apa yang dapat
diharapkan oleh para peserta tes jika
mereka tidak mengerti sesuatu, lama
waktu mereka mengerjakan tes,
respon bagaimana yang akan diberi
skor, apakah disarankan untuk
menebak jawaban bila ragu-ragu dan
bagaimana memperbaiki respons bila
mereka melakukan kesalahan.

Pengetesan Lisan


Tes lisan (oral tes) adalah situasi yang para
peserta tes merespons dengan menjawab
secara lisan : pertanyaan dapat disampaikan
secara lisan , tulis atau keduanya.



Tes pencapaian lisan lebih umum di institusi
pendidikan Eropa daripada di Amerika
Serikat di mana praktek tes lisan semakin
menurun selama abad ke -20 dan tidak biasa
di tingkat pendidikan tinggi dibandingkan
dengan tingkat pendidikan rendah.



Banyak siswa tidak suka tes lisan
dan merasa bahwa tes tersebut
merupakan ukuran pengetahuan
dan pemahaman yang tidak adil.

 


Tetapi guru pidato, seni drama,
bahasa Inggris dan bahasa asing
sering menyesalkan
ketidakperhatian pengabaian seperti
itu adalah orang-orang yang tidak
dapat berbicara dengan benar,
comprehension atau nyaman.

Keunggulan Tes Lisan


Salah satu keunggulan berupa situasi sosial
interaktif yang diberikan pada ujian lisan,
memungkinkan evaluasi ciri pribadi seperti
penampilan, gaya dan cara berbicara. Situasi
bertatap muka ini juga membuat kecurangan
dan barangkali sikap sombong berkurang.



Keunggulan lain dari tes lisan adalah bahwa
tes ini sering mengharuskan respon pada
tingkat intelektual lebih tinggi lebih tinggi
dari pada tes tertulis dan memberikan
praktik komunikasi lisan dan interaksi sosial
secara lisan.



Waktu yang diperlukan untuk menyiapkan dan
mengevaluasi jawaban lisan lebih sedikit
dibandingkan dengan tes tertulis.



Interview struktural yang terdiri dari pertanyaan
dan jawaban lisan sering diadakan terhadap
para pelamar kerja untuk mendapatkan posisi
pada organisasi pemerintah dan industri.

Ujian Lisan versus Ujian Tertulis
 Fakta bahwa skor tes pencapaian lisan hanya
memiliki korelasi moderat dengan skor pada tes
tertulis yang diperbandingkan mengungkapkan
bahwa tes tersebut mengukur aspek pencapaian
yang berbeda.

Pengetesan Kinerja


Tes kertas dan pensil merupakan tes paling
efsien dan objektif dari semua jenis tes,
tetapi tes ini hanya memberikan informasi
tidak langsung mengenai kemampuan orang
untuk mengerjakan atau berbuat sesuatu.



Ada banyak contoh perilaku khusus-situasi
yang banyak dipelajari oleh siswa untuk
memberikan jawaban yang benar di kelas
atau pada tes kertas-pensil tetapi
meninggalkannya ketika berhadapan dengan
situasi nyata di mana perilaku ini
sebenarnya dapat diterapkan.



Karena kehidupan nyata lebih besar
daripada tes tertulis, pengetesan
pencapaian prestasi kadang-kadang
merujuk pada pemeriksaan otentik
(authentic assessment) atau menekankan
bahwa ini merupakan opsi pengetesan
tertulis, pemeriksaan alternative
(alternative assessment).



Tes kinerja tidak terstruktur mengamati
dan mengevaluasi siswa secara rendah
hati/obtrusively) selama di kelas, di aula
atau di taman sekolah.

TERIMA
KASIH