Evaluasi Pembelajaran Matematika Evaluasi Pembelajaran Matematika

MAKALAH
EVALUASI PEMBELAJARAN MATEMATIKA
tentang:

Kualitas Instrumen Evaluasi

oleh:

Kelompok V
Annisa Prihartini

412.291

Setri Yusma Sari

412.381

Lisa Sefrita

412.486


Riza Setia Eka Putri

412.503

Astrina Nofita

412.583

Depi Gusmita

412.239

Dosen Pembimbing:

Dra. Yusmarni, M.Pd

Jurusan Tadris Matematika B Fakultas Tarbiyah dan Keguruan
Institut Agama Islam Negeri (IAIN) Imam Bonjol Padang
1435H/2014M


BAB I
PENGANTAR
Alhamdulilláh segala puji syukur selalu kami haturkan kehadirat Allah Swt. yang mana
karena berkat, rahmat dan ridho-Nyalah kami dapat menyelesaikan makalah ini untuk memenuhi
tugas mata kuliah Evaluasi Pembelajaran Matematika tentang “Kualitas Instrumen Evaluasi”.
Shalawat beserta salam kami ucapkan kepada Allah Swt. semoga disampaikan kepada nabi
Muhammad Saw..
Kami selaku penulis makalah mengucapkan terima kasih kepada dosen mata kuliah
Evaluasi Pembelajaran Matematika, Dra. Yusmarni, M.Pd, yang telah memberikan tugas kepada
kami serta dukungan dan arahannya dalam menyelesaikan makalah ini, orang tua yang selalu
mendukung kelancaran tugas kami, serta pada tim anggota kelompok yang selalu kompak dan
konsisten dalam penyelesaian tugas ini.
Dalam penulisan dan penyusunan makalah ini, kami menyadari karena semakin luas
pembicaraan semakin terlihat jelas segi-segi kelemahan dari makalah ini. Tetapi hal itu
merupakan sebagai jalan yang tidak bisa dihindari untuk perbaikan kedepannya. Oleh karena itu,
kami tidak menutup diri dari para pembaca akan saran dan kritik yang sifatnya membangun demi
perbaikan dan peningkatan kualitas penyusunan makalah dimasa yang akan datang.
Dan kami berharap, semoga makalah ini bisa memberikan suatu kemanfaatan bagi kami
penulis dan para pembaca semuanya. Amin.


Padang,

September 2014

Penulis

i

BAB II
PEMBAHASAN
A. Reliabilitas Instrumen dan Jenisnya
1. Pengertian Reliabilitas
Reliabilitas berasal dari kata reliability yang berarti sejauh mana hasil suatu pengukuran
dapat dipercaya. Hakikat reliabilitas instrumen berhubungan dengan masalah kepercayaan.
Maksudnya suatu hasil pengukuran hanya dapat dipercaya jika dalam beberapa kali pelaksanaan
pengukuran terhadap siswa atau kelompok yang sama diperoleh hasil pengukuran yang relatif
sama, selama aspek yang diukur dalam diri subjek memang belum berubah.
Menurut KBBI (Kamus Besar Bahasa Indonesia, 2010) kata reliabilitas dapat diartikan
sebagai:
1) Sesuatu yang bersifat reliabel (bersifat handal).

2) Ketelitian dan ketepatan teknik pengukuran; keterandalan.
Reliabilitas juga dapat diartikan sama dengan konsistensi atau keajegan atau ketetapan hasil
pengukuran, yaitu seberapa konsistensi skor tes dari suatu pengukuran ke pengukuran berikutnya.
Reliabilitas dinyatakan dengan koefisien reliabilitas, yaitu koefisien korelasi yang menunjukkan
derajat hubungan antara dua hasil pengukuran yang diperoleh dari instrumen atau prosedur yang
sama.
Reliabilitas memberikan konsistensi yang membuat terpenuhinya syarat utama instrumen,
yaitu validnya suatu hasil skor instrumen, dan berkaitan erat dengan syarat ketiga, yaitu
kebermanfaatan (usability). 1 Persyaratan bagi tes yaitu validitas dan reliabilitas ini penting,
artinya dalam hal ini validitas lebih penting, dan reliabilitas ini perlu karena menyokong
terbentuknya validitas.2 Sebuah tes mungkin reliable tetapi tidak valid. Sebaliknya, sebuah tes
yang valid biasanya reliable. Walaupun reliabilitas mempunyai berbagai nama lain seperti
keterpercayaan, keterajegan, keterhandalan, konsistensi, ketetapan dan sebagainya, namun ide
pokok dalam konsep reliabilitas adalah sejauh mana hasil suatu pengukuran dapat dipercaya.

1
2

Sukardi, Evaluasi Pendidikan: prinsip dan operasionalnya, cetakan ke-6, (Jakarta: Bumi Aksara, 2011), hlm. 43
Hamzah B. Uno, Perencanaan Pembelajaran, (Jakarta: Bumi Aksara, 2006), hlm.105


1

Sebagai contoh, kita mengukur panjang sepuluh macam benda sebanyak dua kali pada waktu
yang berbeda dengan menggunakan alat ukur yang tepat. Ada hasil yang kita peroleh misalnya
sama, maka dikatakan bahwa alat ukur yang kita gunakan memberikan hasil validitas
pengukuran yang reliable (tetap, konsisten, stabil).3 Meskipun pengukuran yang dilakukan lebih
dari sekali, namun hasilnya tetap tidak berubah, implikasinya pengukuran tersebut mempunyai
taraf kepercayaan yang tinggi. Untuk mendapatkan hasil pengukuran yang ajeg (reliable), dalam
hal ini memang tidak mudah karena tes ini berhubungan dengan manusia dimana kita ketahui
bahwa manusia itu mempunyai jiwa, dan unsur jiwa itu tidak ajeg atau senantiasa berubah karena
ada di dalamnya kemampuan, kecakapan, sikap, minat, motivasi dan sebagainya.
Reliabilitas suatu tes pada umumnya diekspresikan secara numerik dalam bentuk koefisien
yang besarnya

. Koefisien tinggi menunjukkan reliabilitas tinggi, sebaliknya jika

koefisien suatu tes rendah maka reliabilitas tes rendah. 4 Ekuivalen dengan uraian diatas,
dikarenakan manusia memiliki unsur jiwa yang tidak reliable, sehingga dalam kenyataannya tes
yang mempunyai nilai koefisien reliabilitas sempurna adalah tidak ada. Karena skor itu

kemungkinan besar bervariasi, yang disebabkan oleh terjadinya kesalahan pengukuran yang
berasal dari bermacam-macam sumber. Sehingga reliabilitas tinggi menunjukkan kesalahan
varian yang minim atau hasil pengukuran pertama dan kedua relatif sama atau hampir sama,
begitu pula sebaliknya, hasil pengukuran mempunyai reliabilitas yang rendah bila hasil pertama
jauh berbeda dengan hasil pengukuran kedua. Jika sebuah tes mempunyai reliabilitas tinggi maka
pengaruh kesalahan pengukuran telah terkurangi.
Kesalahan pengukuran dapat disebabkan oleh beberapa faktor diantaranya karakteristik tes
evaluasi itu sendiri, kondisi pelaksanaan tes yang tidak mengikuti aturan baku, tes item yang
meragukan dan siswa langsung mengikuti, status peserta yang mengikuti tes, misalnya seseorang
yang sedang lelah atau mempunyai problem pribadi, siswa mempunyai motivasi rendah atau
kombinasi dari semua gejala tersebut. 5 Reliabilitas yang tinggi menunjukkan bahwa sumbersumber kesalahan telah dihilangkan sebanyak mungkin.

3

Ali Hamzah, Evaluasi Pembelajaran Matematika, cetakan ke-1, (Jakarta: PT RajaGrafindo Persada, 2014), hlm.
230
4
Sukardi, Op.Cit., hlm. 43
5
Ibid., hlm. 44


2

2. Jenis-jenis Reliabilitas
Salah satu syarat agar hasil suatu tes dapat dipercaya adalah tes tersebut harus mempunyai
reliabilitas yang memadai. Oleh karena itu Jaali dan Pudji (2008) membedakan reliabilitas
menjadi 2 macam, yaitu:6


Reliabilitas Konsistensi tanggapan, dan



Reliabilitas konsistensi gabungan item

a. Reliabilitas Konsistensi Tanggapan
Reliabilitas ini selalu mempersoalkan mengenai tanggapa responden atau objek terhadap tes
tersebut apakah sudah baik atau konsisten. Dalam artian apabila tes yang telah di cobakan
tersebut dilakukan pengukuran kembali terhadap obyek yang sama, apakah hasilnya masih
tetap sama dengan pengukuran sebelumnya. Jika hasil pengukuran kedua menunjukkan

ketidakonsistenan, maka hasil pengukuran tersebut tidak mengambarkan keadaan obyek yang
sesungguhnya. Untuk mengetahui apakah suatu tes atau instrument tersebut sudah mantap
atau konsisten, maka tes/instrument tersebut harus diuji kepada obyek ukur yang sama secara
berulang-ulang.
Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan responden terhadap tes (Jaali ;
2008) yaitu :
(1) Teknik test-retest ialah pengetesan dua kali dengan menggunakan suatu tes yang sama
pada waktu yang berbeda.
(2) Teknik belah dua ialah pengetesan (pengukuran) yang dilakukan dengan dua kelompok
item yang setara pada saat yang sama.
(3) Bentuk ekivalen ialah pengetesan (pengukuran) yang dilakukan dengan menggunakan
dua tes yang dibuat setara kemudian diberikan kepada responden atau obyek tes dalam
waktu yang bersamaan.
b. Reliabilitas Konsistensi Gabungan Item
6

Djali, dan Puji Muljono., Pengukuran dalam Bidang Pendidikan, (Jakarta: PT. Gramedia, 2008)

3


Reabilitas ini terkait dengan konsistensi antara item-item suatu tes atau instrument.. Apabila
terhadap bagian obyek ukur yang sama, hasil pengukuran melalui item yang satu kontradiksi
atau tidak konsisten dengan hasil ukur melalui item yang lain maka pengukuran dengan tes
(alat ukur) sebagai suatu kesatuan itu tidak dapat dipercaya. Untuk itu jika terjadi hal
demikian maka kita tidak bisa menyalahkan obyek ukur, melainkan alat ukur (tes) yang
dipersalahkan, dengan mengatakan bahwa tes tersebut tidak reliable atau memiliki reliabilitas
yang rendah.
Koefisien reliabilitas konsistensi gabungan item dapat dihitung dengan menggunakan 3
rumus (Jaali 2008), yakni :
(1) Rumus Kuder-Richardson, yang dikenal dengan nama KR-20 dan KR-21.
(2) Rumus koefisien Alpha atau Alpha Crownbach.
(3) Rumus reliabilitas Hoyt, yang menggunakan analisis varian.
3. Metode-metode Menentukan Reliabilitas
Ada beberapa metode yang biasa digunakan dalam menentukan reliabilitas suatu tes.
Metode-metode yang dimaksud adalah sebagai berikut:

a. Metode Bentuk Paralel (Equivalent-forms)
Yaitu dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan susunan, tetapi
butir-butir soalnya berbeda. Dalam menggunakan metode tes paralel ini, pengetes harus
menyiapkan dua buah tes, dan masing-masing dicobakan pada kelompok siswa yang sama.

Oleh karena itu, metode tes paralel ini dikenal juga dengan double test double trial method.
Penggunaan metode ini baik karena siswa dihadapkan pada dua macam tes sehingga tidak
ada faktor “masih ingat soalnya” yang dalam evaluasi disebut dengan adanya practice-effect
dan carry-offer effect, artinya ada faktor yang dibawa oleh pengikut tes karena sudah
menegrjakan tes tersebut. Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya
berat karena harus menyusun dua seri tes dan harus tersedia waktu yang lama untuk
mencobakan dua kali tes.

b. Metode tes ulang (test-retest method)
4

Metode ini menggunakan satu tes tetapi dicobakan dua kali terhadap kelompok siswa yang
sama dengan interval tertentu, disebut juga dengan single test double trial method. Kemudian
hasil dari kedua tes tersebut dikorelasikan dan koefisien korelasi yang diperoleh menyatakan
reliabilitas tes. Semakin tinggi koefisien reliabilitas tes, tes semakin stabil. Bila tes stabil
maka skor siswa dalam kedua tes cenderung tetap. Pada umumnya hasil tes yang kedua
cenderung lebih baik dari tes yang pertama karena adanya practice-effect atau carry-offer
effect. Oleh karena itu, satu hal yang penting dalam metode test-retest adalah menentukan
interval waktu pelaksanaan tes. Jika interval terlalu pendek maka siswa masih ingat hasil
terdahulu, sebaliknya semakin besar interval waktu maka semakin banyak variabel yang

mempengaruhi hasil tes. Hal inilah yang menjadi kelemahan dari metode test-retest.

c. Metode belah dua (split half method)
Metode ini menggunakan satu tes dan hanya dicobakan satu kali, disebut juga dengan single
test single trial method. Dalam pelaksanaannya, sebuah tes dicobakan kepada siswa seperti
biasanya, kemudian tes dibagi dua dalam pemberian skor.7 Berbeda dengan metode pertama
dan kedua yang setelah diketemukan koefisien korelasi langsung ditafsirkan itulah koefisien
reliabilitas, maka pada metode ketiga ini tidak dapat demikian. Pada waktu membelah dua
dan mengkorelasikan dua belahan, baru diketahui reliabilitas separo tes. Untuk mengetahui
reliabilitas seluruh tes harus digunakan rumus Spearman-Brown berikut ini.

Dimana:
= korelasi antara skor-skor setiap belahan tes
= koefisien reliabilitas yang sudah disesuaikan
Ada dua cara membelah butir-butir soal, yaitu: (1) membelah item-item genap dan item-item
ganjil yang selanjutnya disebut belahan ganjil-genap, dan (2) membelah atas item-item awal

7

Hamzah B. Uno., Satria Koni., Assesment Pembelajaran, cetakan ke-2, (Jakarta: Bumi Aksara, 2012), hlm. 154

5

dan item-item akhir dari soal, yaitu separuh jumlah soal pada nomor-nomor awal dan separuh
jumlah soal pada nomor-nomor akhir yang selanjutnya disebut belahan awal-akhir.8
4. Menentukan Reliabilitas Instrumen
Koefisien reliabilitas instrumen dihitung dengan rumus koefisien Alpha Crownbach, yaitu:

Dengan varians
Dimana:

= nilai reliabilitas
banyaknya item pertanyaan
jumlah varians butir
varians total
skor tiap soal
banyaknya siswa

Sebelum perhitungan terlebih dahulu dibuat tabel kerja dengan langkah-langkah sebagai
berikut:
a. Item-item yang dinyatakan tidak valid dikeluarkan dari instrumen. Jadi reliabilitas
instrumen dihitung hanya untuk item-item yang dinyatakan valid.
b. Menghitung

dan

c. Menghitung varians

untuk tiap-tiap item dan skor total.
untuk tiap-tiap item dan skor total.

d. Menghitung koefisien reliabilitas dengan rumus koefisien Alpha.
e. Pengambilan keputusan dengan memperhatikan kriteria koefisien reliabilitas instrumen
yaitu:9

8

http://hikmatunnailah.blogspot.com/2012/11/reliabilitas_21.html?m=1

6

Nilai

Keterangan
Sangat rendah
Rendah
Sedang
Tinggi
Sangat tinggi

5. Contoh Perhitungan Reliabilitas Instrumen
Misalkan seorang mahasiswa bernama Ugi sedang melakukan penelitian. Dalam penelitian
tersebut Ugi menggunakan kuesioner sebagai instrumen untuk memperoleh informasi dari
responden. Dalam kuesioner tersebut menggunakan skala Likert dimana 1 menyatakan “sangat
tidak setuju”, 2 menyatakan “tidak setuju”, 3 menyatakan “netral”, 4 menyatakan “setuju” dan 5
menyatakan “sangat setuju”. Dalam kuesioner tersebut tersiri dari 4 pertanyaan. Berikut data
yang diperoleh Ugi:
Nama Responden

9

Pertanyaan
Pertama (A)

Kedua (B)

Ketiga (C)

Keempat (D)

Dion

2

1

2

1

Nia

1

3

3

1

Desi

2

2

2

2

Ari

1

1

1

1

Gino

3

3

3

3

Benny

3

3

3

1

Voni

2

2

2

2

Suci

2

3

2

2

Dude

2

1

1

1

Imah

2

3

3

3

http://digilib.unpas.ac.id/download.php?id=1447

7

Penyelesaian:
Nama



(∑

Dion

2

1

2

1

4

1

4

1

6

36

Nia

1

3

3

1

1

9

9

1

8

64

Desi

2

2

2

2

4

4

4

4

8

64

Ari

1

1

1

1

1

1

1

1

4

16

Gino

3

3

3

3

9

9

9

9

12

144

Benny

3

3

3

1

9

9

9

1

10

100

Voni

2

2

2

2

4

4

4

4

8

64

Suci

2

3

2

2

4

9

4

4

9

81

Dude

2

1

1

1

4

1

1

1

5

25

Imah

2

3

3

3

4

9

9

9

11

121

Total

20

22

22

17

44

56

54

35

81

715

Rata-rata 2

0.2

2.2

1.7

4.4

5.6

5.4

3.5

8.1

71.5

Varians

0.76

0.56

0.61

6.64

12.64

9.84

9.25

5.89

1528

0.4

Menghitung varians untuk masing-masing pertanyaan A, B, C, D dan ∑X
a. Menghitung varians untuk pertanyaan A

b. Menghitung varians untuk pertanyaan B

c. Menghitung varians untuk pertanyaan C

d. Menghitung varians untuk pertanyaan D
8

e. Menghitung varians untuk ∑X

Menghitung nilai koefisien reliabilitas Alpha Crownbach

Pengambilan keputusan:
Berdasarkan tabel kriteria koefisien reliabilitas, maka instrumen kuesioner tersebut dikatakan
memiliki reliabilitas yang tinggi karena berada dalam interval

.

6. Faktor-faktor yang Mempengaruhi Reliabilitas10
a. Secara umum jika tes semakin panjang, maka semakin tinggi reliabilitasnya.
b. Penyebaran skor, semakin besar penyebaran skor maka akan semakin tinggi perkiraan
reliabilitasnya.
c. Kesulitan tes. Umumnya tes yang terlalu mudah atau terlalu sulit akan menyebabkan
reliabilitas tes semakin rendah. Hal ini disebabkan terbatasnya penyebaran skor.
d. Objketifitas tes. Tes yang objektifitasnya tinggi memiliki reliabilitas yang lebih tinggi,
karena hasil tesnya tidak dipengaruhi oleh prosedur penskoran.
e. Interval waktu tes. Tes dengan interval waktu yang pendek menyebabkan koefisien
reliabilitas tes yang besar.

B. Potensi Daya Beda Instrumen
Daya beda butir soal yaitu butir soal tersebut dapat membedakan kemampuan individu
peserta didik. Menurut Arikunto (2009: 211) daya beda soal adalah kemampuan sesuatu soal
10

Hamzah B. Uno., Satria Koni., Op.Cit., hlm.155

9

yang dapat membedakan antara peserta didik yang pandai (berkemampuan tinggi) dengan
peserta didik yang kurang pandai (berkemampuan rendah). Sedangkan menurut Surapranata
(2004: 23) indeks daya beda adalah kemampuan soal untuk membedakan antara peserta tes yang
berkemampuan tinggi dengan peserta tes yang berkemampuan rendah. Dari dua pendapat di atas
dapat disimpulkan bahwa soal yang baik adalah soal yang dapat membedakan peserta didik yang
pintar dan peserta didik yang tidak pintar. Soal digunakan oleh seorang evaluator untuk menguji
kelompok yang diuji. Soal akan berfungsi dengan baik jika dapat membedakan kemampuan
orang-orang dalam kelompok tersebut.
Analisis daya pembeda suatu soal tes dimaksudkan untuk mengkaji kemampuan soal untuk
membedakan antara siswa yang memiliki prestasi tinggi dan yang memiliki prestasi rendah.
Karena butir soal yang didukung oleh potensi daya beda yang baik akan mampu membedakan
peserta didik yang memiliki kemampuan tinggi atau pandai dengan peserta didik yang memiliki
kemampua rendah atau kurang pandai. Dengan kata lain jika soal diberikan pada kelompok siswa
yang pintar, hasilnya baik. Jika diberikan kepada kelompok siswa yang kurang pintar, hasilnya
jelek. Soal dikatakan tidak memiliki daya pembeda jika soal tersebut diberikan kepada kelompok
siswa yang pintar dan siswa yang kurang pintar, akan memberikan hasil yang sama. Atau bisa
juga akan jadi berbalik, yaitu jika diberikan kepada anak yang pintar hasilnya jelek, sedangkan
jika diberikan kepada anak yang kurang hasilnya baik.
Dalam penyusuna butir soal seperti tes sebaiknya ada sifat yang menunjukkan kualitasnya,
sehingga:11
1. Tidak dapat dijawab benar oleh siswa kelompok atas maupun siswa kelompok bawah.
2. Dapat dijawab benar oleh siswa kelompok atas tetapi tidak dapat dijawab oleh siswa
kelompok bawah.
3. Dapat dijawab benar oleh siswa kelompok atas maupun siswa kelompok bawah.

Apabila nomor 1 dan 2 terjadi maka dikatakan soal mempunyai daya pembeda, artinya butir
soal itu dapat membedakan antara siswa yang pandai dengan siswa yang kurang pandai.
Penggunaan indeks daya pembeda untuk menyeleksi soal pun tidak dapat diterima sepenuhnya.
Konsep daya pembeda mengharuskan ada siswa yang menjawab salah soal tersebut.
Konsekuensinya soal-soal yang mudah dinilai sebagai soal-soal yang tidak baik. Kita ketahui
11

Ali Hamzah, Op.Cit., hlm.240

10

bahwa soal yang dijawab benar oleh siswa belum tentu soal yang tidak baik malah justru
sebaliknya yang sering terjadi. Karena materi untuk soal-soal seperti itu dinilai esensial, guru
mengajarkannya sedemikian sampai semua siswa mengerti. Penguasaan materi membuat semua
siswa dapat menjawab soal tersebut, sehingga menjadi dasar penilaian soal tersebut mempunyai
tingkat kesukaran yang sangat rendah dan tidak memiliki daya pembeda. Apabila ada butir soal
yang dijawab tidak benar olh siswa, maka dibuat analisis butir soal untuk menetapkan daya
pembedanya.
Rumus yang digunakan untuk mengetahui daya pembeda setiap butir tes adalah:

Dimana:
: daya pembeda butir
: banyaknya kelompok atas yang menjawab betul
: banyaknya kelompok bawah yang menjawab betul
: banyaknya subjek kelompok atas
: banyaknya subjek kelompok bawah
Klasifikasi interpretasi daya pembeda12
Nilai

Interpretasi
Sangat jelek
Jelek
Cukup
Baik
Sangat baik

12

Ibid., hlm.243

11

Contoh:
Dalam sebuah tes ada sebanyak 6 siswa yang menjawab benar dari 10 siswa kelompok atas dan
ada 4 siswa yang menjawab benar dari 10 siswa kelompok bawah. Berapa besar daya beda soal
nomor 1?
Penyelesaian:

12

BAB III
PENUTUP
A. Kesimpulan
Reliabilitas berasal dari kata reliability yang berarti sejauh mana hasil suatu pengukuran
dapat dipercaya. Hakikat reliabilitas instrumen berhubungan dengan masalah kepercayaan.
Maksudnya suatu hasil pengukuran hanya dapat dipercaya jika dalam beberapa kali pelaksanaan
pengukuran terhadap siswa atau kelompok yang sama diperoleh hasil pengukuran yang relatif
sama, selama aspek yang diukur dalam diri subjek memang belum berubah.
Salah satu syarat agar hasil suatu tes dapat dipercaya adalah tes tersebut harus mempunyai
reliabilitas yang memadai. Oleh karena itu Jaali dan Pudji (2008) membedakan reliabilitas
menjadi 2 macam, yaitu: Reliabilitas Konsistensi tanggapan, dan Reliabilitas konsistensi
gabungan item. Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan responden terhadap
tes (Jaali ; 2008) yaitu :
(1) Teknik test-retest ialah pengetesan dua kali dengan menggunakan suatu tes yang sama
pada waktu yang berbeda.
(2) Teknik belah dua ialah pengetesan (pengukuran) yang dilakukan dengan dua kelompok
item yang setara pada saat yang sama.
(3) Bentuk ekivalen ialah pengetesan (pengukuran) yang dilakukan dengan menggunakan
dua tes yang dibuat setara kemudian diberikan kepada responden atau obyek tes dalam
waktu yang bersamaan.

C. Kritik dan Saran
Dalam penulisan dan penyusunan makalah ini, kami menyadari karena semakin luas
pembicaraan semakin terlihat jelas segi-segi kelemahan dari makalah ini. Tetapi hal itu
merupakan sebagai jalan yang tidak bisa dihindari untuk perbaikan kedepannya. Oleh karena itu,
kami tidak menutup diri dari para pembaca akan saran dan kritik yang sifatnya membangun demi
perbaikan dan peningkatan kualitas penyusunan makalah dimasa yang akan datang. Dan kami
berharap, semoga makalah ini bisa memberikan suatu kemanfaatan bagi kami penulis dan para
pembaca semuanya. Amin.
ii

Daftar Pustaka
B. Uno, Hamzah. 2006. Perencanaan Pembelajaran. Cetakan ke-1. Jakarta: PT Bumi Aksara
B. Uno, Hamzah., Koni, Satria. 2012. Assesment Pembelajaran. Cetakan ke-2. Jakarta: PT
Bumi Aksara
Djali., Muljono, Puji. 2008. Pengukuran dalam Bidang Pendidikan. Jakarta: PT Gramedia
Hamzah, Ali. 2014. Evaluasi Pembelajaran Matematika. Cetakan ke-1. Jakarta: PT
RajaGrafindo Persada
http://digilib.unpas.ac.id/download.php?id=1447
http://hikmatunnailah.blogspot.com/2012/11/reliabilitas_21.html?m=1
Sukardi. 2011. Evaluasi Pendidikan: prinsip dan operasionalnya. Cetakan ke-6. Jakarta: Bumi
Aksara

iii