PENGUKURAN ASSESSMENT DAN PENILAIAN EVAL (1)

PENGUKURAN (ASSESSMENT) DAN PENILAIAN (EVALUATION)
HASIL BELAJAR
I. PENDAHULUAN
Menurut Fenton (1996), asesmen (assessment) atau pengukuran hasil belajar ialah pengumpulan
informasi yang relevan, yang dapat dipertanggungjawabkan dalam rangka pengambilan
keputusan. Sedangkan penilaian atau evaluasi (evaluation) ialah aplikasi suatu standar atau sistem
pengambilan keputusan terhadap data asesmen, yaitu untuk menghasilkan keputusan (judgments)
tentang besarnya dan kelayakan pembelajaran yang telah berlangsung. [1]. Asesmen hasil belajar
mahasiswa merupakan satu kesatuan atau bagian dari pembelajaran. Apalah artinya suatu proses
pembelajaran apabila tidak diukur hasil pembelajarannya. Kata asesmen berasal dari Latin
assidere, yang berarti sit beside. Dalam konteks pendidikan, hal ini meliputi kegiatan
mengobservasi belajarnya mahasiswa, yaitu mendeskripsikan, mengumpulkan, merekam,
memberi markah (skor), dan menginterpretasi informasi mengenai pembelajaran mahasiswa.
Kegunaan utama asesmen sebagai bagian dari proses belajar ialah refleksi (cerminan)
pemahaman dan kemajuan mahasiswa secara individual. Mengajar tanpa mengetahui apakah
hasil mengajarnya itu telah “menjadikan mahasiswa itu belajar”, belumlah dapat dikatakan
sebagai “mengajar”.
Proses belajar mengajar memang dilakukan dalam kelompok atau kelas, tetapi seyogianya
seorang pengajar hendaknya peduli (concern) atas pemahaman dan kemajuan belajar setiap
mahasiswa secara individual. Kadang seorang dosen menganggap dirinya sudah mengajar dengan
baik, dan sudah puas apabila ada satu atau dua mahasiswa yang dapat memperoleh skor tinggi,

meskipun lebih dari 80 % mahasiswanya memperoleh skor di bawah rata-rata. Pada zaman dulu,
dosen yang hanya meluluskan sedikit mahasiswa itu dinamakan dosen “killer”, dan merupakan
suatu kebanggaan bagi dosen bahwa mata kuliahnya paling sukar untuk dilulusi. Dalam hal ini
dosen imenggunakan dirinya sendiri sebagai standar pengukuran kemampuan mahasiswa,
bukannya standar yang dirumuskan dalam tujuan (Tujuan Instruksional Umum dan Khusus),
sehingga mahasiswa yang tidak lulus dianggap bodoh atau malas. Di manakah letak kesalahan
dalam proses belajar mengajar, apakah pada mahasiswa yang “belum belajar” karena bodoh, atau
dosen yang “belum mengajar” dengan baik, karena menerapkan sistem pengukuran yang tidak
sesuai atau tidak absah.
Orientasi pembelajaran sudah berubah sejak digunakannya Sistem Kredit Semester SKS).
Seorang dosen menerima sekelompok mahasiswa dalam kelasnya yang terdiri atas individuindividu. Tugas seorang dosen ialah mengajar sedemikian rupa agar masing-masing individu itu
berubah perilakunya dari belum atau tidak memahami, menjadi memahami materi
perkuliahannya. Jadi kalau masih banyak mahasiswa yang belum dapat diluluskan, maka dosen
itu belum berhasil dalam mengajar. Tidak ada mahasiswa yang “bodoh”, apalagi sudah melalui
seleksi ketat agar dapat masuk perguruan tinggi. Dalam hal ini dosen tersebut harus introspeksi
diri sendiri, apakah ia sudah merencanakan pembelajaran dengan baik, apakah telah
melaksanakan pembelajaran sesuai dengan rencana, apakah dosen memberi bimbingan bagi
mahasiswa yang kurang cepat belajar (menurut teori belajar, tidak ada manusia yang presis sama,
ada yang cepat dan ada yang agak lambat belajar), dan yang penting pula ialah apakah metode
asesmen dan evaluasi hasil belajar yang digunakan itu sahih (valid) dan terpercaya (reliable).

II. VALIDITAS (VALIDITY) DAN KETERANDALAN (RELIABILITY)
1

Untuk mengukur dalamnya sumur digunakan meteran; demikian pula untuk mengukur berat
suatu benda digunakan timbangan. Meteran dan timbangan sebagai alat ukur tidak dapat
dipertukarkan untuk tujuan pemakaiannya. Hal ini menyangkut validitas (validity) alat ukur, yang
berlaku pula pada pengukuran keberhasilan pembelajaran yaitu penggunaan instrumen atau alat
yang sesuai dengan tujuan pengukurannya. Instrumen ini hendalnya juga dapat diandalkan
(reliable) atau reprodusibel (reproducible), dalam arti memberikan hasil sama pada setiap
pengukuran, meskipun sampel yang diukur itu berbeda.
Dalam proses belajar mengajar, bentuk asesmen yang absah atau valid ialah yang mengukur apa
yang seharusnya diukur, sebagai contoh:
 bukannya mengukur ingatan, jika yang harus diukur ialah pemecahan masalah, dan
sebaliknya.
 tidak menilai seseorang mengenai kualitas tulisannya, apabila keterampilan menulis itu
tidak relevan dengan topik yang akan diukur. Berbeda halnya jika tulisan memang
merupakan salah satu aspek penilaian.
 dimaksudkan untuk mengukur sebanyak mungkin materi dan keterampilan, bukan hanya
berdasarkan sejumlah kecil sampel (lihat pula keterandalan = reliability).
Sayang sekali, tidak ada bentuk asesmen yang benar-benar absah (valid).

Keterandalan (reliability) disebut juga keterulangan (replicability). Suatu asesmen yang
terandalkan akan memberikan hasil yang sama pada pengulangan, dan akan menghasilkan hasil
yang sama pada kelompok mehasiswa kelas paralel, sehingga harus konsisten metode dan
kriterianya.
III. TUJUAN ASESMEN
Tujuan asesmen secara tradisional ialah untuk asesmen formatif dan sumatif. Asesmen sumatif
ialah pengukuran terhadap apa yang menjadi tujuan akhir mahasiswa, biasanya pada akhir
penyajian satu mata kuliah atau modul, yang dapat digunakan untuk mengambil keputusan dalam
menyatakan seorang mahasiswa itu lulus atau tidak (asesmen produk akhir). Perlu diperhatikan
bahwa semua asesmen sumatif dapat pula berfungsi sebagai formatif, yaitu apabila dapat
memberikan umpan balik yang cukup. Asesmen formatif berlangsung terus menerus selama
proses pembelajaran sehingga disebut juga asesmen proses. Tujuannya ialah untuk memberikan
umpan balik mengenai apa yang telah dipelajari mahasiswa :
- bagi mahasiswa : untuk mengidentifikasi pencapaian (achievement) dan informasi
mengenai bidang tugas selanjutnya.
- bagi pengajar : untuk mengevaluasi proses pembelajaran sampai pada saat ini, dan
menetapkan rencana selanjutnya.
Pada asesmen sumatif, nilai atau markah memegang peranan penting, namun fungsi asesmen
formatif hanyalah untuk memberikan umpan balik. Jika pada asesmen sumatif penilaiannya
mengacu pada pencapaian tujuan mata kuliah (Tujuan Instruksional Umum = TIU) secara

keseluruhan , maka asesmen formatif hanya mengukur pencapaian tujuan antara (Tujuan
Instruksional Khusus = TIK), dalam rangka perbaikan proses pembelajaran (dosen dan
mahasiswa) apabila belum tercapai oleh mahasiswa.
2

IV ASESMEN MENGGUNAKAN INSTRUMEN NON-TES
Umumnya asesmen dilakukan dalam bentuk ujian berupa tes, yaitu pertanyaan yang harus
dijawab mahasiswa, dan jawabannya sudah tersedia. Jarang sekali digunakan asesmen bentuk
lain, padahal mungkin lebih sesuai digunakan untuk pengukuran tujuan instruksional tertentu.
Alat ukur (instrumen) yang dapat digunakan ialah pedoman obeservasi, skala sikap, daftar cek
dan lain-lain.
Hasil belajar mahasiswa bukan saja di bidang kognitif, tetapi juga afektif dan psikomotor. Kerja
Praktek Lapangan dan Kerja Laboratorium yang lebih mengutamakan penampilan kemampuan
dan keterampilan (performans) tidaklah sesuai apabila diukur hasil belajarnya melalui pertanyaan
bentuk tes. Untuk ini lebih cocok digunakan pedoman observasi, karena yang lebih penting ialah
apa yang dapat dibuat oleh mahasiswa, bukannya apa yang diketahuinya atau dipahaminya.
Demikian pula untuk mengukur tujuan belajar di bidang afektif, lebih cocok menggunakan
pedoman observasi sebagai alat ukur.
Alat ukur hasil belajar non-tes yang sering digunakan ialah :
1. Participation Chart (bagan partisipasi).

Formulir berbentuk bagan ini terutama digunakan pada obeservasi, misalnya keikutsertaan
(partisipasi) mahasiswa dalam diskusi kelompok. Partisipasi mahasiswa secara suka rela atau
belajar aktif ini merupakan suatu tujuan belajar ( ranah afektif) dalam rangka meningkatkan
daya tahan ingatan (retensi) mengenai materi pelajaran, meningkatkan rasa percaya diri,
harga diri, dan lain-lain. Formulir yang digunakan terdiri atas daftar nama mahasiswa dan 4
kolom yang menyatakan kualitas kontribusi masing-masing mahasiswa dalam diskusi dengan
pengisian jumlah (tally) banyaknya masing-masing kontribusi. (contoh formulir dapat dilihat
pada lampiran).
2. Chek List (daftar cek).
Daftar cek berguna untuk mengukur hasil belajar berupa produk maupun proses, yang dapat
dirinci dalam komponen-komponen yang lebih kecil, terdefinisi atau sangat spesifik. Semakin
lengkap komponennya (termasuk yang tidak terlalu penting) semakin besar manfaatnya
dalam pengukuran. Daftar cek terdiri atas komponen atau aspek yang diamati dan tanda cek
yang menyatakan ada tidaknya komponen itu dalam observasi. (contoh daftar cek dapat
dilihat pada lampiran).
3. Rating Scale (skala lajuan).
Alat ukur non-tes ini menggunakan suatu prosedur terstruktur untuk memperoleh informasi
tentang sesuatu yang diobservasi, yang menyatakan posisi sesuatu itu dalam hubungannya
dengan yang lain. Skala ini berisi seperangkat pernyataan tentang karakteristik, atau kualitas
dari sesuatu yang akan diukur beserta pasangannya yang menunjukkan peringkat karakter

atau kualitas yang dimiliki. Jadi suatu skala lajuan terdiri atas 2 bagian, yaitu (1) pernyataan
tentang keberadaan atau kualitas keberadaan suatu unsur atau karakteristik, (2) petunjuk
penilaian tentang pernyataan tersebut.
Skala lajuan terdiri atas beberapa tipe :
3

A. Numerical Rating Scale. Komponen skala lajuan ini adalah pernyataan tentang
karakteristik atau kualitas tertentu dari sesuatu yang diukur keberadaannya, diikuti oleh
angka yang menunjukkan keberadaannya . Lihat contoh pada lampiran.
B. Descriptive Graphic Rating Scale. Skala lajuan ini tidak menggunakan angka tetapi
dengan memberi tanda tertentu pada suatu kontinuum baris. Tipe skala lajuan ini baik
digunakan untuk mendeskripsikan profil dari suatu kegiatan, prosedur atau hasil dari
kegiatan tertentu.
C. Ranking Methods Rating Scales.
Kegunaan menyusun ranking mempunyai 2 kegunaan : (1) menyusun ranking kedudukan
mahasiswa dalam aspek tertentu atau keseluruhan aspek hasil belajar dan (2) untuk
memeriksa kemampuan mahasiswa dalam menentukan kedudukan relative suatu
komponen dalam prosedur tertentu. Caranya ialah dengan menentukan dahulu ranking
tertinggi dan terendah, lalu bergerak ke tengah.
D. Paired Comparison Rating Scale.

Tipe ini digunakan untuk membandingkan hasil kerja atau tugas seorang mahasiswa
dengan yang lainnya. Setiap kali diputuskan hasil kerja terbaik dari perbandingan 2 orang
mahasiswa. Hasil pembandingan dilakukan menggunakan matriksi seperti pada contoh di
lampiran.
4. Attitude Scales (skala sikap).
Untuk memahami pengukuran sikap (attitude), perlu dipahami dulu pengertian sikap sebagai
suatu konsep psikologi. Sikap harus memenuhi 2 kriteria, yaitu dapat diamati dan dapat
diukur. Bila salah satunya tidak ada, maka konstruksi tersebut tidak dapat digunakan dalam
penelitian ilmiah. Definisi terakhir tentang sikap : Sikap adalah identitas kecenderungan
positif atau negative terhadap suatuobjek psikologis tertentu. Secara umum definisi Thurstone
(1946) ini dapat dirumuskan : Attitude is (1) affect for or against, (2) evaluation of, (3) like
or dislike of, (4) positiveness or negativeness toward a psychological object .
Konstruksi skala sikap dimulai dengan menentukan dan mendefinisikan objek sikap yang
akan diukur itu (sikap apa). Setelah itu dikumpulkan butir-butir pernyataan tentang objek
sikap itu. Kemudian ditentukan format jawaban yang akan digunakan dan cara penskoran.
Ada beberapa teknik konstruksi skala sikap; yang terkenal ialah :
A Skala Likert
B. Skala Thurstone, terbagi lagi atas tiga teknik skala sikap : (1) metode Paired Comparisons,
(2) metode Equal-appearing Intervals, dan (3) Successive Intervals.
C. Skala Guttmann

Yang paling umum digunakan ialah Skala Likert. Prinsip penggunaan skala ini ialah
menentukan lokasi kedudukan seseorang dalam suatu continuum sikap terhadap suatu objek
sikap, mulai dari sangat negatif sampai dengan sangat positif. Penentuan lokasi dilakukan
dengan mengkuantifikasi pernyataan seseorang terhadap butir pernyataan. Skala 1 berarti
sangat negatif dan skala 5 berarti sangat positif. Lihat contoh pada lampiran.
V. ASESMEN MENGGUNAKAN INSTRUMEN TES
PENILAIAN ACUAN PATOKAN (PAP) DAN PENILAIAN ACUAN NORMA (PAN)
PAN dan PAP digunakan pada asesmen yang menggunakan ujian atau tes sebagai alat ukur.
4

Penilaian Acuan Norma (PAN) atau norm-referenced test pada dasarnya merupakan suatu
kompetisi antara mahasiswa yang akan menghasilkan ranking mahasiswa, 5% teratas
memperoleh nilai A, 10% berikutnya mendapat B , dan seterusnya 50% terbawah tidak lulus.(Ini
sekedar contoh). Metode asesmen ini cukup baik apabila tujuannya ialah untuk menyeleksi
jumlah orang (terbaik) tertentu untuk suatu jabatan, menentukan tempat seseorang pada mata
kuliah atau untuk masuk menjadi anggota tim tertentu. Kualitas hasil akan sangat berbeda dari
kelompok yang satu dengan yang lain. Di sini seakan-akan digunakan sistem gugur bagi yang
kalah bersaing. Contoh penggunaannya ialah pada tes I.Q (Intelligent Quotient).
Penilaian Acuan Patokan (PAP) atau Kriteria (Criterion-Reference Test) ialah istilah yang
digunakan untuk asesmen terhadap suatu kriteria yang pasti. Secara teoretis, dapat berarti bahwa

yang mengikuti tes ini dapat lulus atau tidak berdasarkan kriteria yang sudah ditetapkan. Tes PAN
sebenarnya juga menetapkan kriteria, tetapi lebih menekankan pada aplikasi statistik. Jadi
sebenarnya Tes PAP lebih adil, asalkan kriteria telah ditetapkan sebelumnya dan tes itu sahih dan
terandalkan.
Ada lagi jenis asesmen yang dinamakan asesmen ipsatif, yaitu asesmen sendiri atau lebih tepat
asesmen terhadap kinerja terbaik sendiri di waktu lalu. Asesmen ini digunakan untuk tujuan
khusus, misalnya peningkatan kinerja pelatih (coach olahraga), dan pada pendidikan dan
pembelajaran khusus.
VI. ASESMEN ALTERNATIF (ALTERNATIVE ASSESSMENT)
Karakteristik jenis asesmen demikian itu ialah :
1. mahasiswa terlibat dalam tugas performans yang berarti
2. terdapat standar dan kriteria yang jelas tentang kinerja yang paling baik (excellence).
3. terdapat penekanan pada metakognisi (metacognition) dan evaluasi diri.
4. mahasiswa menampilkan produk dan performans yang berkualitas.
5. terdapat interaksi positif antara orang yang mengases dan yang diases.
Terdapat 2 segi (feature) utama pada asesmen alternatif:
1. semuanya dianggap sebagai alternatif lain daripada tes pilihan ganda tradisional,
standardized achievement tests.
2. semuanya merupakan asesmen langsung mengenai performans mahasiswa untuk tugas
signifikan yang relevan dengan kehidupan di luar sekolah.

Perbandingan ketiga bentuk asesmen (Burke K.,1998 dan Fogarty R.,1998 ) :
Asesmen tradisional (Traditional Assessments), difokuskan pada nilai (grade) dan kedudukan
(ranking), pengetahuan, kurikulum, dan ketrampilan, yang diimplementasikan melalui
asesmen di kelas (test, kuis, tugas pekerjaan rumah), dan tes baku (PAN atau PAP).
Asesmen Performans (Performance Assessments), yang difokuskan pada hasil dan standar
yang dapat diamati, aplikasi dan transfer yang diimplementasikan sesuai standar, tugas,
kriteria dan rubrik penskoran.

5

Asesmen Portfolio (Portfolio Assessments), dengan fokus pada pertumbuhan (growth) dan
perkembangan (development) seiring waktu, yang diimplementasikan melalui seleksi,
refleksi, dan pemeriksaan tugas kelas sesuai dengan tujuan dan evaluasi-diri.
Asesmen performans difokuskan pada observasi langsung performans mahasiswa. Mahasiswa
menciptakan projek atau menampilkan (perform) tugas-tugas berdasarkan standar, kriteria dan
indikator yang telah ditetapkan sebelumnya, yang dievaluasi menggunakan rubrik penskoran.
Dosen senantiasa dapat mengobservasi mahasiswanya belajar di kelas. Namun untuk
mendokumentasikan pengamatan ini tidaklah gampang dan makan waktu banyak. Akhir-akhir ini
telah dikembangkan berbagai instrumen untuk mengumpulkan dan mengorganisasikan data yang
diamati itu.


VI.1 PENDAHULUAN
Sejak pertengahan tahun 1980-an banyak dipersoalkan kelemahan tes baku yang biasa digunakan
pada evaluasi hasil belajar mahasiswa. Tes baku ini didasarkan pada prinsip-prinsip validitas,
reliabilitas, keadilan dan kemanfaatannya, serta akurasi pengukuran hasil belajar. Tes baku ini
dipersoalkan karena seakan-akan terpisah atau terisolir dari proses pembelajaran secara
keseluruhan. Isu yang berkembang pada saat itu ialah tentang dua hal yaitu, pertama hubungan
antara tes dengan kurikulum dan proses pembelajaran, dan kedua hal yang berkaitan dengan tes
kinera (performance-test). Sebenarnya perkembangan di bidang tes yang tradisional itu cukup
pesat dengan pendekatan statistik untuk menginterpretasikan hasil tes, misalnya penerapan Item
Response Theory (IRT) dalam pengukuran hasil belajar, aplikasi tes adaptif (adaptive testing)
dan pengembangan bank soal (item banking). Perkembangan pendekatan statistik ini yang
ditunjang oleh teknologi komputer memerlukan adanya pendidikan atau pelatihan khusus
.sehingga perkembangan IRT lebih banyak diaplikasikan di bidang psikologi (pengukuran
psikologis). Para ahli tes dan pengukuran hasil belajar pada umumnya tidak tertarik pada
pendidikan atau pelatihan lanjut dalam bidang statistika itu, sehingga memilih untuk semakin
mengembangkan asesmen alternatif. Dengan demikian semakin berkembang asesmen alternatif
ini di kalangan ahli dan praktisi pendidikan. Asesmen alternatif dianggap sebagai upaya untuk
mengintegrasikan kegiatan pengukuran hasil belajar dengan keseluruhan proses pembelajaran,
sehingga asesmen itu merupakan bagian yang tidak terpisah dari proses pembelajaran.
(James Atherton, 2001)
VI.2 Latar Belakang Psikologis
(Asmawi Zainul, 2001 “Alternative Assessment”, PAU-PPAI, DitJenDikti , DepDikNas)
Karakteristik utama asesmen alternatif bukan saja mengukur hasil belajar (achievement)
mahasiswa, tetapi juga memberi informasi yang jelas tentang proses pembelajaran. Asesmen ini
sangat terkait dengan teori belajar. Ada beberapa teori belajar yang dapat dijadikan landasan kuat
untuk pelaksanaan asesmen alternatif.
Asesmen alternatif
Asesmen otentik (Authentic Assessment) atau asesmen kinerja (performance assessment), adalah
salah satu bentuk atau sinonim asesmen alternatif. Suatu asesmen dikatakan otentik apabila
secara langsung diukur (diamati) perilaku mahasiswa mengerjakan tugas intelektual yang
6

penting. Lebih sepsifik, asesmen otentik itu diartikan sebagai proses penilaian kinerja perilaku
mahasiswa secara multidimensional pada situasi nyata (life-like performance behavior).
Sedangkan asesmen kinerja disefinisikan sebagai proses perolehan (achievement), penerapan
pengetahuan dan keterampilan melalui proses pembelajaran, yang menunjukkan kemampuan
mahasiswa dalam proses itu atau dalam produk yang dihasilkan. Sebaliknya, asesmen tradisional
bergantung pada sesuatu yang tak langsung atau bentuk substitusinya yang disederhanakan, yang
mungkin dapat ditarik inferensi yang valid tentang kinerja mahasiswa pada tantangan bernilai itu.
The Building Tool Room, (available on line at : www.newhorizons.org/assmtterms.html)
menjelaskan asesmen alternatif sebagai :
“ …to describe alternatives to traditional, standardized, norm or criterion-refernced traditional
paper and pencil testing. An alternative assessment might require students to answer an openended question, work out a solution to a problem, perform a demonstration of a skill, or in some
way produce work rather than select an answer from choices on a sheet of paper”
Beberapa perbandingan dengan tes baku yang tradisional :
Jadi asesmen alternatif ialah alternatif pengukuran atau evaluasi hasil belajar mahasiswa yang
lain daripada ujian tradisional yang sudah baku, misalnya menggunakan ujian “essay” atau
“multiple choice”, menggunakan batas lulus (passing grade atau PAP) atau berdasarkan rata-rata
kelas (Penilaian acuan norma = PAN), dan pengukuran lain yang menggunakan kertas dan pinsil
(paper and pencil test). Asesmen alternatif mungkin mengharuskan mahasiswa untuk :
 menjawab pertanyaan yang “open-ended” (tidak ada jawaban standar),
 mengerjakan penyelesaian suatu masalah,
 mendemonstrasikan suatu ketrampilan, atau
 menghasilkan suatu karya,
Asesmen alternatif dapat menggunakan Rubrik Penskoran (Scoring Rubrics), Portfolio atau
Observasi oleh instruktor.
Perbandingan asesmen alternatif dengan asesmen tradisional ;
 Asesmen otentik mengharuskan mahasiswa menampilkan pengetahuan yang diperolehnya
secara efektif (Asesmen tradisional : hanya mengungkapkan kemampuan mahasiswa
mengidentifikasi, mengingat kembali apa yang sudah dipelajarnya di luar konteksnya,
contohnya sama dengan mengajar mengemudikan mobil scara lisan).
 Asesmen otentik memberikan mahasiswa keseluruhan tugas yang mencerminkan prioritasnya,
dan tantangan yang ditemukan dalam kegiatan instruksional yang terbaik, misalnya
melaksanakan penelitian; menulis, mereivsi dan mendiskusikan makalah; memberikan analisis
oral tentang peristiwa politik terakhir; bekerjasama dengan orang lain dalam debat, dst.nya. Tes
konvensional biasanya terbatas pada pertanyaan dengan satu jawaban yang benar, yang
dinamakan “paper and pencil test”.
 Asesmen otentik menghendaki bahwa mahasiswa dapat menciptakan jawaban yang berbahasa
ilmiah, menyeluruh dan dapat dijustifikasi.
 Asesmen otentik mencapai validitas dan keterandalan (reliability) dengan cara meningkatkan
dan membakukan kriteria yang sesuai untuk menskor produk yang sangat bervariasi,
sedangkan tes tradisional membakukan butir tes objektif, sehingga hanya mempunyai 1
jawaban yang benar.
7

 Uji validitas sebagian tergantung pada : apakah tes itu mensimulasikan tes kemampuan lulusan
dalam dunia nyata kelak. Validitas pada tes pilihan ganda ditentukan dengan cara
membandingkan butir tes dengan isi kurikulum, atau melalui korelasi dengan butir tes yang
lain.
Mengapa diperlukan Asesmen Alternatif yang banyak memerlukan banyak waktu dan tenaga
untuk mempersiapkannya ?
Meskipun tes pilihan ganda dapat merupakan indikator atau prediktor yang valid mengenai
penampilan akademik, seringkali tes ini mengalihkan perhatian (mislead) dosen dan mahasiswa
tentang jenis keterampilan yang seharusnya dikuasai mahasiswa. Norma bukan merupakan
standar; butir soal bukanlah masalah yang sebenarnya; dan jawaban yang benar bukanlah
rationale (dasar pemikiran, alasan). Mereka yang mempertahankan tes tradisional tidak melihat
bahwa bentuk tesnya, bukannya isi tes yang merugikan proses belajar. Mahasiswa merasa bahwa
belajar itu menyesakkan, dosen percaya bahwa tes itu adalah pencari fakta, pemaksaan yang
terdiri atas susunan pertanyaan, yang sebenarnya tidak relevan dengan tujuan dan keberhasilan
belajar mahasiswa. Baik dosen maupun mahasiswa digiring pada keyakinan bahwa jawaban yang
benar itu lebih penting daripada kebiasaan berpikir, dan justifikasi pendekatan serta hasil
pekerjaan seseorang.
Karena itu pendekatan terhadap tugas dan hasil yang otentik dapat meningkatkan proses
pengajaran dan belajar; mahasiswa memperoleh kejelasan yang lebih besar tentang kewajiban
mereka (dan diminta mengerjakan tugas yang lebih menarik hati), dan dosen akan percaya bahwa
hasil asesmen itu lebih berarti dan lebih berguna dalam meningkatkan proses pembelajaran.
Apabila tujuan dosen hanya untuk memonitor kinerja mahasiswa, maka tes konvensional
mungkin sudah memadai. Tetapi apabila tujuan dosen ialah meningkatkan kinerja ke arah yang
lebih baik, maka tes itu hendaknya terdiri atas tugas yang dapat dijadikan contoh, kriteria dan
standar.
Apakah kita ingin mengevaluasi:
pengajuan masalah dan penyeleaian masalah dalam bidang matematika
penelitian eksperimental dalam sains
berbicara, mendengarkan, dan memfasilitasi suatu diskusi
melakukan inkuiri sejarah berdasar-dokumen
secara teliti merevisi suatu tulisan sampai dapat terbaca oleh pembaca ?
Pada asesmen otentik, mahasiswa :
melakukan eksperimen sains
melaksanakan penelitian ilmu sosial
menulis cerita dan laporan
membaca dan menginterpretasi sastra
menyelesaikan masalah matematik
Asesmen otentik menggunakan sampel penampilan (performance samples), kegiatan belajar,
kemampuan berpikir, yang terdiri atas 5 sampel penampilan utama :
1. Asesmen kinerja (Performance Assessment), penulisan, revisi, penyajian laporan
2. Penelitian pendek (Short Investigations)
8

3. Open-Response Questions
4. Portfolio
5. Self-Assessment
Asesmen Kinerja (Performance Assessment)
Asesmen ini merupakan suatu observasi sistematik secara langsung, dan penilaian terhadap
tercapainya suatu tujuan (instruksional). Seringkali oberservasi dilakukan terus menerus selama
periode waktu tertentu, dan secara khusus penilaian menyangkut pengkreasian suatu produk.
Asesmen dapat berbentuk interaksi kontinu antara dosen dan mahasiswa, dan secara ideal
menjadi bagian dari proses pembelajaran. Asesmen hendaknya merupakan performans dari
kenyataan yang relevan dengan komunitas mahasiswa dan lingkungannya. Asesmen performans
ini dilakukan menggunakan rubrik, atau panduan penskoran analitik yang dapat membantu
objektivitasnya. Asesmen berdasar-performans berbentuk suatu tes penerapan pengetahuan dalam
keadaan kehidupan sehari-hari, Performans tugas merupakan suatu contoh dalam
mendemonstrasikan kemampuan intelektual.
Asesmen kinerja sering dipertukarkan dengan asesmen altenatif atau asesmen otentik. Pengertian
dasarnya adalah asesmen yang mengharuskan mahasiswa mempertunjukkan kinerja, bukan
menjawab atau memilih jawaban yang tersedia. Misalnya mahasiswa diminta menjelaskan suatu
peristiwa sejarah penting dengan menggunakan kata-kata atau cara sendiri. Dengan demikian
mahasiswa diharapkan dapat menunjukkan penguasaannya tentang sejarah itu. Contoh lain ialah
memecahkan masalah matematika dengan cara dan hasil yang benar, atau menetapkan kadar
suatu senyawa obat tertentu menggunakan metode dan prosedur yang benar yang dipilih sendiri
oleh mahasiswa. Dapat pula mahasiswa diminta menyusun suatu hipotesis. Semuanya itu
diberikan dalam bentuk tugas atau task. Dalam menilai pencapaian tugas yang diberikan
kepada mahasiswa tersebut, perlu ditetapkan kriteria yang disepakati terlebih dahulu, yang
disebut rubrik. Dengan demikian maka asesmen kinerja yang utama ialah tugas (tasks) dan
rubrik (rubrics) sebagai kriteria penilaian..
Rubrik Penskoran ( Scoring Rubrics)
Rubrik
Suatu rubrik secara umum ialah patokan penskoran yang digunakan dalam asesmen subjektif.
Suatu rubrik mengharuskan adanya suatu aturan tentang penetapan kriteria pada sistem asesmen
yang harus diikuti pada evaluasi. Rubrik dapat berbentuk deskripsi eksplisit tentang karaktersitik
performans tertentu pada suatu rentangan skala. Rubrik penskoran secara eksplisit menunjukkan
kualitas performans yang diharapkan menurut rentang skala, atau definisi tentang suatu titik skor
tertentu pada skala.
Rubrik penskoran ialah skema penilaian deskriptif, yang digunakan sebagai patokan dalam
menganalisis produk maupun proses usaha dan keberhasilan mahasiswa. Rubrik ini digunakan
untuk penilaian (judgment) kualitas, dan dapat digunakan untuk mengevaluasi berbagai subyek
ataupun kegiatan. Salah satu contoh penggunaan rubrik penskoran ialah sebagai panduan dalam
mengevaluasi suatu tulisan ilmiah, atau suatu presentasi oral (seminar mahasiswa). Penilaian
kualitas tulisan atau presentasi oral cenderung berbeda-beda menurut kriteria yang ditetapkan
9

oleh masing-masing evaluator. Evaluator yang satu mungkin kebih menekankan pada gramatika
penulisan, yang lainnya mungkin pada segi argumentasi dalam tulisan. Dengan
dikembangkannya skema penilaian sebelumnya untuk proses evaluasi, subyekyivitas evaluator
yang terlibat itu akan lebih menjadi objektif.
Rubric adalah skala lajuan (rating scales), berbeda dengan ceklist, yang digunakan pada asesmen
penampilan (performance assessment). Rubrik secara formal dirancang sebagai pedoman
penskoran, yang terdiri atas criteria penampilan spesifik yang telah dirancang sebelumnya, dan
digunakan untuk menilai hasilkerja mahasiswa pada asesmen penampilan. Secara khas, rubrik
merupakan format spesifik dari suatu instrumen penskoran yang digunakan untuk mengevaluasi
penampilan mahasiswa atau produk yang dihasilkan dari suatu tugas penampilan.
Terdapat 2 jenis rubrik :
1. Rubrik Holistik, penskoran dilakukan terhadap proses keseluruhan atau kesatuan produk
tanpa menilai bagian komponen secara terpisah. Contoh: Rubrik untuk Penilaian pada
Seminar Rencana Penelitian dan hasil Penelitian.
2. Rubrik Analitik, penskoran mula-mula dilakukan atas bagian-bagian individual produk atau
penampilan secara terpisah, kemudian dijumlahkan skor individual itu untuk memperoleh
skor total.

Scoring Instruments for
Performance Assessments

Rating Scales
Checklists

Rubrics

10

Analytical Rubrics

Holistic Rubrics

Rubrik Holistik
Rubrik holistic biasanya digunakan apabila kesalahan pada bagian dari proses masih dapat
ditolerir, asalkan kualitas keseluruhannya cukup tinggi. Penggunaan rubric holistic mungkin tidak
sesuai bagi suatu tugas penampilan yang mengharuskan mahasiswa untuk menciptakan respons
tertentu, atau tidak terdapat jawaban benar secara pasti. Fokus dari suatu skor yang menggunakan
rubrik holistik ialah terhadap kualitas secara keseluruhan, kemahiran atau pemahaman terhadap
isi dan ketrampilan spesifik, jadi meliputi asesmen yang bertaraf unidimensi. Penggunaan rubrik
holistic dapat menghasilkan proses scoring yang lebih cepat dibanding rubrik analitik. Pada
dasarnya hal ini disebabkan oleh karena si penilai atau pemeriksa diharapkan untuk membaca ,
memeriksa produk atau penampilan mahasiswa hanya sekali dalam rangka memperoleh kesan
yang menyeluruh tentang hasil pekerjaan mahasiswa. Karena intinya ialah asesmen keseluruhan
penampilan, maka rubrik holistik digunakan secara khas, meskipun tidak eksklusif apabila tujuan
asesmen penampilan itu bersifat sumatif. Pada umumnya, hanya dapat diberikan kepada
mahasiswa umpan balik yang sangat terbatas sebagai hasil penskoran tugas penampilan
menggunakan cara ini. Sebuah contoh rubrik penskoran holistik dapat dilihat pada Tabel 1.

Tabel 1
Template for Holistic Rubrics
Skor Uraian
5
Memperlihatkan pemahaman yang lengkap tentang permasalahan. Semua
persyaratan tentang tugas terdapat dalam jawaban
4
Memperlihatkan
cukup pemahaman tentang permasalahan. Semua
persyaratan tentang tugas terdapat dalam jawaban
3
Memperlihatkan hanya sebagian pemahaman tentang permasalahan.
Kebanyakan persyaratan tentang tugas terdapat dalam jawaban
2
Memperlihatkan sedikit pemahaman tentang permasalahan. Banyak
persyaratan tugas yang tidak ada
1
Memperlihatkan tidak ada pemahaman tentang permasalahan
0
Tidak ada jawaban / Tidak ada usaha
Rubrik Analitik
Rubrik Analitik biasanya dipilih apabila dinginkan tipe respons yang cukup terfokus, yaitu untuk
tugas penampilan yang mungkin mempunyai 1 atau 2 jawaban, dan kreativitas tidak terlalu
11

esensial dalam jawaban mahasiswa. Lagipula, pada mulanya rubric analitik terdiri atas beberapa
skor, yang diikuti dengan penjumlahan untuk skor akhir. Penggunaannya mewakili asesmen pada
tingkatan multidimensi. Seperti telah dikatakan semula bahwa penggunaan rubric analitik dapat
mengakibatkan proses penskoran itu sangat lambat, sebagai akibat dari pengukuran berbagai
ketrampilan atau karakteristik yang sangat berbeda, yang masing-masing memerlukan
pemeriksaan berulang kali. Baik pengkonstruksiannya maupun pada penggunaannya memerlukan
waktu yang lama. Ketentuan umumnya ialah bahwa pemeriksaan pekerjaan seseorang itu
memerlukan waktu tersendiri untuk setiap tugas penampilan yang spesifik atau criteria
penskoran. Namun demikian, keuntungan penggunaan rubric analitik itu sangat berarti. Derajat
umpanbalik yang diberikan kepada mahasiswa (dan dosen) sangatlah bermakna. Mahasiswa
menerima umpanbalik spesifik terhadap setiap kriteria penskoran individual dari penampilannya,
dan hal ini tidak terjadi pada penggunaan rubrik holistic. Setelah itu dimungkinkan untuk
menciptakan suatu “profil” tentang kekuatan dan kelemahan mahasiswa secara spesifik. Pada
Tabel 2 disajikan templat rubrik penskoran analitik.
Sebelum mendesain rubrik yang spesifik, perlu ditetapkan terlebih dahulu apakah penampilan
atau produk itu akan diskor secara holistik atau analitik. Menggunakan rubric apapun, perlu
diidentifikasi dan dirumuskan kriteria penampilan spesifik (TIK) dan indikator yang dapat
diamati, sebagai langkah awal pengembangan. Keputusan tentang pemilihan pendekatan
holistik atau analitik pada penskoran mempunyai beberapa kemungkinan implikasi. Hal
terpenting yang perlu dipertimbangkan terlebih dahulu ialah bagaimana akan menggunakan hasil
akhirnya. Apabila diinginkan skor sumatif secara keseluruhan, lebih baik memilih pendekatan
holistik. Sebaliknya, jika tujuannya ialah umpanbalik formatif , maka gunakanlah rubrik
penskoran analitik. Perlu dicatat, bahwa jenis pendekatan yang satu tidaklah lebih baik dari yang
lain, yang penting ialah, mana yang sesuai untuk tujuan yang diinginkan. Implikasi lain meliputi
waktu yang dibutuhkan, sifat tugas itu sendiri, dan kriteria penampilan spesifik yang diamati.
Tabel 2
Templat untuk rubrik analitik
Tahap Awal
Pengembangan
1
2
Kriteria # 1

Uraian
menggambarkan
tahap awal
penampilan

Kriteria # 2

Uraian
menggambarkan
tahap awal
penampilan

Kriteria # 3

Uraian
menggambarkan
tahap awal
penampilan

Kriteria # 4

Uraian
menggambarkan
tahap awal

Uraian
menggambarkan
gerakan ke arah
tingkat penguasaan
penampilan
Uraian
menggambarkan
gerakan ke arah
tingkat penguasaan
penampilan
Uraian
menggambarkan
gerakan ke arah
tingkat penguasaan
penampilan
Uraian
menggambarkan
gerakan ke arah

Terselesaikan
3

Patut Dicontoh Skor
4

Uraian
menggambarkan
pencapaian tingkat
penguasaan
penampilan
Uraian
menggambarkan
pencapaian tingkat
penguasaan
penampilan
Uraian
menggambarkan
pencapaian tingkat
penguasaan
penampilan
Uraian
menggambarkan
pencapaian tingkat

Uraian
menggambarkan
tingkat
penampilan
tertinggi
Uraian
menggambarkan
tingkat
penampilan
tertinggi
Uraian
menggambarkan
tingkat
penampilan
tertinggi
Uraian
menggambarkan
tingkat

12

penampilan

tingkat penguasaan
penampilan

penguasaan
penampilan

penampilan
tertinggi

Seperti terlihat pada templat 1 dan 2, berbagai tingkatan penampilan mahasiswa itu dapat
ditetapkan menggunakan label kuantitatif ( misalnya numerik) , atau kualitatif (misanya
deskriptif). Dalam hal tertentu mungkin diperlukan kedua label, kualitatif maupun kuantitatif.
Jika suatu rubrik mengandung 4 tingkatan kemahiran atau pengertian dakam suatu kontinuum
(kelanjutan), maka label kuantitatifnya akan berkisar antara “1” sampai “4”. Lebih fleksibel dan
lebih kreatif apabila menggunakan label kualitatif . Suatu tipe umum skala kualitatif dapat
meliputi label sebagai berikut : master, expert, apprentice, and novice. Hampir semua tipe skala
kualitatif dapat digunakan asalkan sesuai dengan tugas.
Salah satu aspek penting pada penskoran kinerja mahasiswa menggunakan rubrik ialah
pengubahannya / pengkonversiannya menjadi markah / nilai (grading). Pada rubrik, sebaiknya
tidak digunakan persentase. Sebagai contoh, jika suatu rubrik mempunyai 6 tingkatan atau angka,
maka angka 3 tidak dapat diartikan sama dengan 50 % pengetahuan (setara dengan nilai E = tidak
lulus). Proses konversi skor rubrik ke nilai atau kategori lebih merupakan proses logika daripada
matematis. Diusulkan oleh Trice (2000), agar dalam sistem penskoran rubrik, lebih banyak skor
(nilai) berada pada kategori rata-rata dan di atas rata-rata (setara nilai C dan lebih baik, dibanding
di bawah rata-rata. Sebagai contoh, jika rubrik terdiri atas 9 kategori skor, diberikan pada tabel 3.
Tabel 3
Sampel Nilai dan Kategori
Skor Rubrik
Nilai (Grade)
8
A+
7
A
6
B+
5
B
4
C+
3
C
2
E
1
E
0
E

Kategori
Sangat Baik
Sangat Baik
Baik
Baik
Cukup
Cukup
Tidak memuaskan
Tidak memuaskan
Tidak memuaskan

LANGKAH-LANGKAH PERANCANGAN RUBRIK PENSKORAN
Langkah 1.
Periksa kembali Tujuan Instruksional (TIK) yang dituju oleh tugas. Hal ini perlu untuk
menyamakan pedoman penskoran Anda dengan TIK dan pelaksanaan pembelajaran.
Langkah 2.
Mengidentifikasi atribut spesifik (indikator) yang dapat diamat,i yang ingin Anda lihat (maupun
yang tidak ingin Anda lihat), yang akan ditampilkan mahasiswa dalam produk, proses maupun
kinerjanya.
Perlu diperinci karakteristik, ketrampilan, atau perilaku yang akan Anda cari, maupun kesalahan
umum yang tidak mau Anda lihat.
Langkah 3
13

Diskusikan karakteristik yang menyertai setiap atribut. Identifikasi cara untuk menguraikan:
kinerja di atas rata-rata, rata-rata, dan di bawah rata-rata untuk setiap atribut yang dapat diamati
pada langkah 2.
Langkah 4a.
Untuk rubrik holistik, tuliskan deskripsi naratif yang lengkap untuk hasilkerja yang sangat baik
dan sangat buruk, dengan memasukkan setiap atribut ke dalam dekripsi itu. Uraikan tingkat
kinerja tertinggi dan terendah dengan memadukan deskripsi untuk semua atribut.
Langkah 4b.
Untuk rubrik analitik, tuliskan deskripsi naratif lengkap untuk hasilkerja yang sangat baik dan
sangat buruk untuk setiap atribut secara individual. Uraikan tingkat kinerja tertinggi dan yang
terendah dengan menggunakan deskriptor untuk setiap atribut secara terpisah.
Langkah 5a.
Untuk rubrik holistik, lengkapi rubrik dengan menguraikan tingkataan lain pada kontinuum yang
berkisar dari kinerja yang sangat baik sampai buruk dari atribut secara kolektif. Tuliskan
deskripsi untuk semua tingkatan antara dari kinerja
Langkah 5b.
Untuk rubrik analitik, lengkapi rubrik dengan cara menguraikan tingkat-tingkat lain pasa
kontinuum yang berkisar dari sangat baik sampai buruk untuk setiap atributf. Tuliskan uraian
untuk semua tingkat antara dari kinerja secara terpisah untuk setiap atribut .
Langkah 6
Kumpulkan sampel dari pekerjaan mahasiswa yang mewakili contoh setiap tingkat. Ini akan
berguna sebagai “benchmark” (batas ambang = batas minimal) dan membantu Anda pada
penskoran di waktu yang akan datang.
Langkah 7
Revisi rubrik sesuai kebutuhan. Siapkan keefektifan rubrik, perbaiki sebelum digunakan di lain
waktu.
CONTOH RANCANGAN RUBRIK PENSKORAN (menggunakan langkah-langkah 1-7)
Contoh I: Rubrik Holistik
 Pokok Bahasan : Matematik; subpokok bahasan : analisis data yang difokuskan pada
ketrampilan mengestimasi dan menginterpretasi grafik . Secara khusus pada akhir unit
ini, dosen dapat mengases (menilai) penguasaan mahasiswa akan TIK :
menginterpretasi grafik batang (bar) dengan cara yang sesuai
mengestimasi (secara akurat) nilai-nilai dalam grafik batang
(Langkah 1)
 Karena maksud tugas kinerja ini bersifat sumatif (nilai akan digabung dengan skor
mahasiswa), maka dirancang suatu rubrik holistik. Untuk ini diidentifikasi 4 atribut
berikut sebagai fokus rubriknya : estimasi, komputasi matematik, kesimpulan, dan
mengkomunikasi penjelasannya
(Langkah 2 dan 3)

14

 Pada akhirnya dibuat konsep deskripsi dari berbagai tingkat kinerja untuk atribut
yangdapat diamati itu (Langkah 4 dan 5). Hasil akhir rubrik dapat dilihat pada Tabel 4.
Tabel 4
Tugas Kinerja Matematik – Rubrik Penskoran
Analisis Data
Skor
Uraian
4
3
2

1
0

Melakukan estimasi akurat. Menggunakan operasi matematik yang sesuai tanpa
salah. Mengambil kesimpulan logis yang didukung oleh grafik. Sangat baik
memberikan penjelasan pemikiran.
Melakukan estimasi yang baik. Menggunakan operasi matematik yang sesuai
dengan sedikit kesalahan.Mengambil kesimpulan yang logis yang didukung
oleh grafik. Memberikan penjelasan pemikiran yang baik.
Berusaha melakukan estimasi , meskipun kebanyakan tidak akurat.
Menggunakan operasi matematik yang tidak sesuai, meskipun tanpa salah.
Mengambil kesimpulan yang tidak didukung oleh grafik. Sedikit memberikan
penjelasan
Melakukan estimasi tidak akurat. Menggunakan operasi matematik yang tidak
sesuai. Tidak ada kesimpulan yang berkaitan dengan grafik. Tidak memberikan
penjelasan cara berpikir.
Tidak ada jawaban / tugas tidak selesai

Contoh: Penilaian Ujian Skripsi Jurusan farmasi PANCASAKTI (Seminar II)
ASPEK PENILAIAN
1. Teknik Penulisan Ilmiah
2. Konsistensi Penulisan Ilmiah
3. Penyajian Materi
4. Penguasaan Materi
5. Kejujuran Ilmiah
JUMLAH NILAI RATA-RATA
Kriteria Penilaian : A = ≥ 80
B = 71-79
C = 61-70
Tidak lulus
= ≤ 60

NILAI (ANGKA)

Pertanyaan :
1. Bagaimana yang dikatakan Teknik Penulisan Ilmiah yang baik ? , sehingga dapat diberi
nilai, misalnya 90
2. Apa yang dimaksud dengan Konsistensi Penulisan Ilmiah ?
3. Apa yang dinilai pada Penyajian Materi ?
4. Bagaimana Penguasaan Materi yang Baik ?
5. Apa yang dimaksud sengan Kejujuran Ilmiah ?
15

Jawaban (sementara):
1. Teknik Penulisan Ilmiah yang baik, apabila :
- Judul Tulisan dirumuskan dengan baik
- Permasalahan dirumuskan berdasarkan latar belakang yang kuat
- Metode yang dipilih sesuai dengan cara pembuktian (hipotesis)
- Hasil yang diperoleh dirmuskan dalam Kesimpulan yang menunjang judul.
2. Konsistensi Penulisan Ilmiah sebaiknya diganti : Bentuk dan Format, yang meliputi pula
penggunaan Bahasa Indonesia yang baik dan benar
- Pendahuluan berisi latar belakang, metode eksperimen dan cara pengambilan
kesimpulan
- Pola Penelitian yang berisi pola pikir untuk mencapai kesimpulan
- Tinjauan Pustaka yang relevan dengan Pola Penelitian, disertai notasi
- Cara Kerja yang sesuai dengan Pola Penelitian
3.

16

Contoh : Rubrik Asesmen / Kriteria untuk Rencana Penelitian
(Education 690 : Assessment Rubric/Criteria for Research Plan)
Kriteria
Dan Kualitas
Pendahuluan
Topik
Hipotesis atau
Permasalahan

Kurang
Tidak terdapat referensi
latar belakang
judul yang dipilih
Hipotesis atau
Permasalahan
kurang jelas
(10)

Baik
Pembaca dapat
menyimak keseluruhan masalah
atau judul.
Permasalahan atau hipotesis telah
dinyatakan, namun tidak terlalu
jelas tentang pengujiannya
(11-13)

Sangat Baik
- Judul cukup jelas dipaparkan dalam
bentuk pola rancangan yang mengacu
pada arah pelaporan
-Hipotesis jelas dan dapat diuji
- Apabila diajukan dalam bentuk
permasalahan, maka telah terandung
ide-ide yang relevan untuk diteliti
(14-15)

Nilai
(Angka)
Maks.
15

Metodologi :
Sampel

Tidak jelas siapa partisipan
atau populasi yang
diwakilinya
(10)

Ada informasi tentang partisipan,
tapi tidak jelas jumlahnya,
bagaimana seleksinya, atau
populasi mana yang diwakilinya
(11-13)

Metodologi:
Instrumen,
Bahan, dan
Rancangan

- Tidak diuraikan mengenai
instrumen dan bahan.
- Sangat terbatas diskusi
tentang penggunaan
rancangan percobaan, jika
diperlukan suatu rancangan
pada penelitian ini (10)

-Telah diidentifikasi instrument dan
bahan, namun informasi tentang
kegunaannya tidak tercantum
dalam laporan
-Apabila diperlukan desain
percobaan, hal ini telah diuraikan.
(11-13)

Jumlah partisipan, cara seleksinya,
populasi yang diwakilinya, semua jelas
teridentifikasi
(14-15)
-Semua instrumen yang akan
digunakan telah diidentifikasi dan
dijustifikasi.
-Telah didiskusikan tentang ukuran
keterandalan dan kesahihannya.
-Apabila dimerlukan desain
percobaan, hal ini telah diuraikan
secara sangat jelas (14-15)

Metodologi :
Prosedur

Prosedur, bila ada
diberikan, sangat terbatas
untuk mengidentifikasi agar
penelitian berhasil

Bagian atau Bab tentang prosedur
telah cukup menjelaskan cara
seleksi sample, bagaimana desain
akan diimplementasikan, dan oleh
siapa atau metode apa yang
digunakan untuk mengumpulkan
data
(11-13)

Prosedur telah diuraikan dengan jelas
dan gambling
Peneliti lain yang akan mereplikasi
penelitian ini memperoleh informasi
yang cukup untuk dapat mengikuti
setiap langkah penelitian
(14-15)

Uraian tentang teknik yang akan
digunakan dalam menganalisis data
telah diberikan. Namun teknik
statistik yang digunakan mungkin
keliru atau tidak dijustifikasi. (7 -8)

Cara analisis telah dijustifikasi dan
sesuai tentang cara pembentukan
kelompok, jumlah kelompok yang
terlibat, jumlah variable, dan jenis data
yang dikumpulkan.
(9-10)

Maks. 10

(10)

Analisis data

Tidak didiskusikan tentang
jenis analisis data yang
akan digunakan
(5)

Maks.
15

Maks.
15

Maks.
15

Jadwal
Pelaksanaan

Tidak disajikan jadwal
waktu pelaksanaan
(1)

Terdapat informasi tentang kapan
rencana dilaksanakan. Jadwal
waktu tertentu diragukan dapat
terlaksana dalam kondisi normal
(2-3)

Jadwal waktu pelaksanaan sudah
dijelaskan dan perkiraan waktu
pelaksanaan penelitian sangat logis
(4-5)

Maks. 5

Kejelasan
Penulisan

Sukar disimak apa yang
ingin diungkapkan oleh
penulis. Banyak ejaan kata
yang salah, gramatika dan
penggunaan tanda baca
yang keliru (10)

Secara umum penulisannya jelas,
namun masih digunakan kata-kata
yang mubazir. Banyak pengertian
yang hanya tersirat, tidak tersurat.
Ada struktur paragraph dan kalimat
yang masih berulang. (11-13)

Cara penulisannya jelas, singkat dan
padat.
Kadang
penulisnya
menggunakan kalimat aktif apabila
sesuai.

Maks. 15

Material dimasukkan
terlambat lebih dari satu
semester (5)

Material dimasukkan sampai akhir
semester
(7-8)

Material dimasukkan tepat waktu

Ketepatan
Waktu
Jumlah
Nilai

61-70

71-80

(14-15)

Maks.10

(9-10)

100

> 80

17

C

B

A

Daftar Pustaka
1 Asmawi Zainul , 2001 “Alternative Assessment”, PAU-PPAI, DirJen Dikti,
DepDikNas

PORTFOLIO (Helen C.Barrett (1988) , Strategic Questions: What to Consider When
Planning for Electronic Portfolios, in Learning & Leading with Technology.)
Definisi Portfolio
Portfolio, ialah suatu pengumpulan hasil kerja mahasiswa yang dilakukan secara sistematik
dan terorganisasi, yang mengungkapkan bukti nyata usaha-usaha yang dilakukan mahasiswa,
hasil perolehannya, dan perkembangannya dalam kurun waktu tertentu. Pengumpulan data ini
hendaknya melibatkan mahasiswa dalam pemilahan materi pelajaran, dan mencantumkan
informasi tentang kriteria penampilannya (performans), rubruk atau criteria untuk menilai
keuntungan yang diperoleh, dan bukti tentang refleksi-diri dan evaluasi mahasiswa. Portfolio
meliputi hasil kerja yang representatif, memberikan suatu dokumentasi tentang performans
mahasiswa, dan meruapakan dasar untuk mengevaluasi kemajuan yang dicapai mahasiswa.
Portfolio dapat meliputi berbagai demonstrasi belajar yang telah dikumpulkan dalam bentuk
koleksi fisik materi, video, CD-ROM, jurnal reflektif, dll.
Definisi portfolio: (Grant Wiggins,2000)….kumpulan representatif hasilkarya seseorang;
contoh karya itu terpola untuk suatu tujuan tertentu dan dapat dibawa-bawa untuk pemeriksaan
atau dipamerkan.
Rick Stiggins (1994) mendefinisikan portfolio debagai suatu kumpulan hasilkerja
mahasiswa yang memperlihatkan suatu keberhasilan atau perbaikan. Materi yang dikumpulkan
dan cerita yang disampaikan sangat bervariasi menurut fungsi konteks asesmannya. Dikatakan
selanjutnya bahwa portfolio adalah “ suatu cara untuk mengkomunikasikan pertumbuhan dan
perkembangan mahasiswa, bukan suatu bentuk asesmen”
(Northwest Evaluation Association, 1990)
Suatu portfolio merupakan kumpulan karya mahasiswa (yang dikumpulkan untuk tujuan
tertentu), yang memperlihatkan usaha mahasiswa, kemajuan maupun pencapaiannya dalam salah
satu bidang atau lebih. Kumpulan karya itu meliputi kegiatan (partisipasi) mahasiswa pada
pemilahan isi, kriteria untuk pemilihan; kriteria penilaian kegunaannya, dan bukti refleksi-diri
mahasiswa. Format penyimpanan portfolio secara tradisional dalam pendidikan menggunakan
kertas, biasanya dalam map manila, pencatatan atau lemari. Biasanya artifak (data bukti) terdiri
atas teks dan gambar pada kertas, yang belakangan digantikan oleh pita video atau audio.
Penyimpanan portfolio tanpa Komputer:
Penyimpanan portfolio biasnaya dilakukan dalam buku catatan, (map) folder dalam laci arsip,
kotak atau lemari. Ada juga yang menggunakan foto, pita audio atau video untuk penyimpanan
hasilkerja mahasiswa.
Apa isi portfolio Elektronik maupun Tradisional ?
18

Suatu portfolio hendaknya berisi unsur-unsur berikut :
 Tujuan instruksional
 Pedoman untuk pengumpulan materi (agar koleksi tidak amburadul)
 Contoh pekerjaan yang dipilih mahasiswa maupun dosen
 Umpanbalik dosen
 Bagian-Bagian refelksi diri mahasiswa
 Kriteria yang jelas dan sesuai untuk mengevaluasi pekerjaan (rubrik berdasarkan standar)
 Standar dan contoh hasilkerja yang baik.
Berbagai Tujuan Portfolio
Ada 3 tujuan umum pengembangan portfolio :
1. Portfolio Pembelajaran (Learning / Formative Portfolios), yang biasanya digunakan
sebagai alat bantu pengembangan profesional yang berkelanjutan.
2. Portfolio Asesmen (Assessment / Summative Portfolios), yang biasanya digunakan pada
proses evaluasi formal.
3. Portfolio Tenaga Kerja/Job (Employment/Marketing Portfolios), yang digunakan untuk
tujuan pengadaan tenaga kerja.
Pembedaan lain :
1. Working Portfolios
2. Showcase or Best Works Portfolios
3. Assessment Portfolios
Tampak di atas bahwa portfolio dapat dijadikan salah satu bentuk asesmen alternatif. Istilah
asesmen alternatif, asesmen otentik atau asesmen berdasar-kinerja (performance-based
assessments) seringkal digunakan sebagai sinonim (pengertian sama), yaitu berbagai asesmen
performans yang lebih mengutamakan mahasiswa memperlihatkan suatu jawaban, bukannya
memilih suatu jawaban.
Asesmen Portfolio. Portfolio dapat diukur dalam berbagai cara. Setiap bagian dapat diskoring
secara individual, atau hanya diukur bagian-bagian penting yang dikehendaki, atau digunakan
proses penskoran secara menyeluruh (holistic), dan dilakukan evaluasi berdasarkan kumpulan
hasil pekerjaan mahasiswa secara menyeluruh. Menjadi kebiasaan bahwa para evaluator
berunding sebelumnya untuk mencapai kesepakatann tentang standar penilaian dalam rangka
mencapai tingkat kepercayaan (reliability) tinggi dalam mengevaluasi mahasiswa. Kriteria yang
ditetapkan itu akan digunakan oleh reviuwer dan mahasiswa yang terlibat, dalam proses
mengevaluasi kemajuan dan pencapaian tujuan (instruksional).
ELECTRONIC PORTFOLIOS
(Educational Technology; An Encyclopedia, ABC-CLIO,2001)

19

Suatu inovasi yang dikembangkan awal tahun 1990 ialah portfolio elektronik, yaitu
penggabungan berbagai teknologi elektronik untuk menciptakan dan mempublikasikan portfolio
yang dapat dibaca dengan komputer atau Video player.
Para ahli seni (artis) telah menggunakan p