mata kuliah evaluasi olahraga 2014

MATA KULIAH EVALUASI
OLAHRAGA
KODE 409
BEBAN MATAKULIAH 2 SKS
DENGAN RINCIAN
2 SKS TEORI
1 SKS PRAKTEK
PADA SEMSMTER IV DI PRODI PKO
JURURSAN PENDIDIKAN KEPALTIHAN
FAKULTAS ILMU KEOLAHRAGAAN
UNIVERSITAS NEGERI YOGYAKARTA
2015

EVALUASI OLAHRAGA
• Dalam melakukan evaluasi ada tiga istilah

yang digunakan yaitu: Pengukuran,
Asesmen, dan Evaluasi
• Pengukuran adalah penetapan angka dengan
cara yang sistematik untuk menyatakan
keadaan individu ( Allen & Yen, 1979)

• Keadaan Indivudu dapat berupa kemampuan
kognitif, Afektif, dan Psikomotor.
• Pengukuran membandingkan hasil
pengamatan dengan kriteria.
• Asesmen adalah semua cara yang digunakan
untuk menilai unjuk kerja individu dan
kelompok ( TGAT, 1987)

• Proses asesmen meliputi pengumpulan

data atau bukti tentang pencapaian belajar
peserta didik.
• Data atau bukti tidak hanya diperoleh
melalui tes saja, tetapi dapat dikumpulkan
melalui pengamatan atau laporan diri.
• Asesmen menjelaskan dan menafsirkan
hasil pengukuran.
• Evaluasi suatu rangkaian kegiatan dalam
meningkatkan kualitas, kinerja dan
produktivitas suatu lembaga dalam

melaksanakan program.
• Evaluasi adalah penetapan nilai atau
implikasi suuatu perilaku.
• Pengukuran, asesmen dan evaluasi adalah
hirarki

PENGUKURAN
• Pengukuran dapat untuk mengetahui

keberhasilan suatu program.
• Pengukuran merupakan kegiatan penentuan
angka bagi suat objek secara sistematik.
• Penentuan angka bertujuan untuk
menggambarkan karakteristik suatu objek.
• Penentuan karakteristik individu harus sekecil
mungkin mengandung kesalahan.
• Kesalahan ilmu alam sebagian besar
disebabkan alat ukurnya, sedangkan
kesalahan ilmu sosial disebabkan oleh alat
ukur, cara mengukur, dan keadaan objek

yang diukur.

• Prinsip alat ukur yang digunakan harus

memiliki bukti kesahihan dan kehandalan.
• Kesahihan alat ukur dapat dilihat dari
konstruk alat ukur, yaitu mengukur seperti
yang direncanakan.
• Konstruk alat ukur dapat ditelaah pada
aspek materi, teknik penulisan, dan bahasa
yang digunakan.
• Kasahihan alat ukur dapat dilihat dari kisikisi alat ukur.
• Hasil pengukuran harus memiliki kesalahan
sekecil mungkin.
• Tingkat kesalahan berkaitan dengan
kehandalan alat ukur.
• Alat ukur yang handal memberikan hasil
yang konstan bila digunakan berulangulang.

• Kesalahan pengukuran ada yang


bersifat acak dan ada yang bersifat
sistematik.
• Kesalahan acak disebabkan kondisi
fisik dan mental (emosi,cemasdll)
yang diukur dan yang mengukur
bervariasi.
• Kesalahan yang sistematik
disebabkan oleh alat ukurnya, yang
diukur dan yang mengukur.

PENILAIAN
• Asesmen merupakan komponen penting

dalam proses berlatih melatih atlet di klub
• Peningkatan prestasi dapat ditempuh melalui
peningkatan kualitas proses berlatih melatih
dan kualitas sistem penilaian.
• Penilaian memerlukan data yang baik
mutunya sehingga perlu didukung oleh proses

pengukuran yang baik.
• Kegiatan penilaian dalam proses pembelajaran
atau proses berlatih melatih perlu diarahkan
pada empat hal, ( Chittenden, 1991)

4 (Empat) kegiatan
penilaian

• Penelusuran yaitu menelusuri apakah proses

pembelajaran atau proses berlatih melatih
yang telah dilakukan sesuai yang direncanakan
atau tidak. Pelatih mengumpulkan berbagai
informasi selama proses berlatih melatih
dengan berbagai pengukuran untuk
memperoleh gambaran tentang pencapaian
prestasi atlet.
• Pengecekan yaitu mencari informasi apakah
terdapat kekuranganpada atlet selama proses
berlatih melatih. Pelatih melakukan berbagai

pengukuran untuk memperoleh gambaran
menyangkut kemampuan atlet, apa yang telah
berhasil dikuasai dan apa yang belum dikuasai.

• Pencarian yaitu mencari dan menemukan

penyebab kekurangan yang muncul selama
proses berlatih melatih berlangsung. Dengan
cara ini pelatih dapat secepatnya mencari
solusi untuk mengatasi kendala2 yang
timbul selama proses berlatih melatih.
• Penyimpulan yaitu menyimpulkan tentang
tingkat pencapaian berlatih melatih yang
telah diikuti atlet. Hal ini sangat penting bagi
atlet untuk mengetahui tingkat pencapaian
yang diperoleh atlet selama berlatih melatih.
Hasil penyimpulan dapat digunakan sebagai
laporan hasil tentang kemajuan berlatih atlet
untuk atlet sendiri, orang tua dll


EVALUASI
• Evaluasi suatu rangkaian kegiatan dalam







meningkatkan kualitas, kinerja dan produktivitas
suatu lembaga dalam melaksanakan program.
Evaluasi adalah penetapan nilai atau implikasi suuatu
perilaku.
Fokus evaluasi pada individu yaitu prestasi berlatih
melatih yang dicapai kelompok atau regu.
Evaluasi akan diperoleh informasi apa yang telah
dicapai dan mana yang belum, sehingga informasi ini
dapat digunakan untuk perbaikan suatu program
latihan.
Evaluasi adalah judgment terhadap nilai atau

implikasi dari hasil pengukuran ( Griffin & Nox, (1991)
Kegiatan evaluasi selalu didahului dengan kegiatan
pengukuran dan penilaian

• Evaluasi secara singkat dapat didefinisikan

sebagai proses mengumpulkan informasi
untuk mengethui pencapaian belajar atau
berlatih melatih di regu atau kelompok.
• Hasil evaluasi diharapkan dapat mendorong
pelatih untuk melatih/mengajar lebih baik dan
mendorong atlet/anak latih untuk berlatih
lebih baik
• Evaluasi adalah melakukan judgment terhadap
hasil penilaian, maka kesalahan pada
penilaian dan pengukuran harus sekecil
mungkin
• Tiga hal yang harus dievaluasi agar dapat
meningkatkan kualitas berlatih yaitu masukan,
lingkungan berlatih, hasil prestasinya.


ACUAN NORMA DAN
KRETERIA

• Dua acuan yang digunakan dalam

menyiapkan tes dan menafsirkan hasil tes
yaitu acuan norma dan acuan kreteria
• Kedua acuan menggunakan asumsi yang
berbeda tentang kemampuan atlet
• Acuan norma berasumsi bahwa
kemampuan orang itu berbeda dan dapat
digambarkan menurut distribusi normal.
• Acuan kreteria berasumsi bahwa hampir
semua orang bisa berlatih apa saja namun
waktunya yang berbeda
• Penafsiran skor hasil selalu dibandingkan
dengan kreteria yang telah ditetapkan
lebih dahulu


SYARAT-SYARAT INSTRUMEN
TES

• Suatu instrumen tes maupun non tes

harus memiliki bukti kesahihan
(validitas), dan keandalan (reabilitas).
• Validitas berasal dari kata validity yang
mempunyai arti sejauhmana akurasi
suatu tes atau skala dalam menjalankan
pengukurannya.
• Reabilitas berasal dari kata reliability
yang mempunyai arti dimana suatu
pengukuran yang menghasilkan data
dan memiliki tingkat reliabilitas tinggi
disebut sebagai pengukuran yang
reliabel.

VALIDITAS
• Pengukuran dikatakan mempunyai


validitas yang tinggi, bila
menghasilkan data yang secara akurat
memberikan gambaran mengenai
variabel yang diukur.
• Akurat yang artinya tepat, cermat, dan
mudah digunakan sehingga apabila tes
menghasilkan data yang tidak relevan
dengan tujuan pengukuran maka
dikatakan sebagai pengukuran yang
memiliki validitas rendah

BUKTI VALIDITAS
• Validitas (keandalan) merupakan indeks

yang menunjukkan tingkat keajekan atau
konsistensi suatu tes. Validitas dapat
dibuktikan dengan tiga cara.
• Validitas isi
a. Validitas Tampang
b. Validitas Logis
• Validitas Konstrak
• Validitas berdasar Kriteria
a. Validitas Prediktif
b. Validitas Konkuren

1. VALIDITAS ISI
• Validitas berdasarkan isi dapat

diperoleh dari suatu analisis hubungan
antara isi tes dan konstrak yang ingin
diukur.
• Validitas berdasarkan isi tes dilakukan
oleh panel pakar pada bidang yang
diukur dan pakar bidang pengukuran.
• Validitas isi dapat dijelaskan melalui
validitas tampang ( face validity) dan
validitas logis ( logical validity).

a. VALIDITAS TAMPANG ( FACE
VALIDITY )

• Validitas tampang adalah bukti validitas

yang memiliki signifikansi yang rendah,
dikarenakan hanya berdasarkan pada
penilaian terhadap format penampilan
tes dan kesesuaian konteks iatem
dengan tujuan ukur tes.
• Validitas tampang yang tinggi (tampak
menyakinkan) akan memancing motivasi
individu yang dites untuk menghadapi
tes tersebut dengan bersungguhsungguh.

b. VALIDITAS LOGIS (LOGICAL
VALIDITY)

• Validitas logis kadang-kadang disebut

sebagai validitas sampling (sampling
validity).
• Validitas logis menuntut batasan yang
seksama terhadap perilaku yang diukur
dan suatu desain logis yang dapat
mencakup bagian perilaku yang diukur
• Validitas logis akan memperoleh nilai
tinggi, harus dirancang sedemikian
rupa sehingga benar-benar berisi
hanya aitem yang relevan sebagai
bagian dari keseluruhan tes.

2. VALIDITAS KONSTRAK
• Validitas konstrak adalah validitas yang

menunjukkan sejauhmana hasil tes
mampu mengungkap suatu trait atau
konstrak teoritik yang hendak diukurnya.
• Pengujian validitas konstrak merupakan
proses yang terus berlanjut sejalan
dengan perkembangan konsep
mengenai trait yang diukur.
• Konsep validitas konstrak sangat
berguna pada tes yang mengukur trait
yang tidak memiliki kriteria eksternal

Validitas konstrak dapat dicapai
melalui beberapa cara

• Studi mengenai perbedaan di antara

kelompok –kelompok yang menurut
teori harus berbeda.
• Studi mengenai pengaruh perubahan
dalam diri individu dan
lingkungannya terhadap hasil tes.
• Studi mengenai korelasi diantara
berbagai variabel yang menurut teori
mengukur aspek yang sama.
• Studi korelasi antar – aitem atau
antar – belahan tes.

3. VALIDITAS BERDASAR
KRITERIA

• Validitas tes berdasar kriteria

menghendaki tersedianya kriteria
eksternal yang dapat dijadikan dasar
pengujian skor tes.
• Kriteria adalah variabel perilaku yang
akan diprediksikan oleh skor tes atau
berupa suatu ukuran lain yang relevan.
• Estimasi tingginya validitas berdasarkan
kriteria, dilakukan
komputasi/perhitungan kofisien korelasi
antara skor tes dengan skor kriteria.

a. Validitas Prediktif
• Validitas prediktif sangat penting, bila tes

dimaksudkan untuk berfungsi sebagai
prediktor bagi performan/prestasi di
waktu yang akan datang.
• Validitas prediktif diperoleh apabila
pengambilan skor kreteria tidak
bersamaan dengan pengambilan skor
tes.
• Prosedur validitas prediktif memerlukan
waktu yang lama dan biaya yang besar
karena prosedurnya bukan berdasar pada
pekerjaan yang telah dianalisis.

• Validitas prediktif, dimana skor

performan/prestasi yang diprediksi
dijadikan sebagai kriteria validasi.
• Contohnya tes seleksi masuk PT yg
bertujuan untuk menjaring para
calon mhs yg diprediksi akan
memiliki prestasi belajar yang bagus
bila diterima sebagai mahasiswa.( yg
diprediksi dari skor tes masuk PTN
adalah prestasi belajar dalam bentuk
IPK).

b. Validitas Konkuren
• Bila suatu tes tdk difungsikan sebagai

prediktor prestasi, kreteria validitasnya
pada ukuran lain yg relevan dengan
tujuan tes yg bersangkutan.
• Validitas konkuren merupakan
koefisien korelasi antara skor tes yang
divalidasi dengan ukuran kreteria lain.
• Contohnya, bila kita menyusun skala
tes dan dikorelasikan dengan tes yang
ada yang mempunyai fungsi yang
sama, misal tes intelegensi yang anda
buat dengan tes intelegensi yang
sudah ada.

• Validitas konkuren apabila skor tes dan

skor kreteria diperoleh dalam waktu
yang relatif sama.
• Validitas konkuren merupakan indikasi
validitas yang layak digunakan, bila
tesnya tidak dirancang sebagai
prediktor dan ia merupakan validitas yg
sangat penting dalam situasi diagnostik.
• Validitas konkuren bila dirncang sebagai
prediktor bagi prestasi di masa datang,
maka estimasi validitas konkuren tidak
akan memuaskan dan presedur viliditas
prediktif merupakan keharusan
digunakan.

RELIABILITAS
• Reliabilitas atau keandalan merupakan

koefisien yang menunjukkan tingkat
keajegan atau konsistensi hasil
pengukuran suatu tes.
• Konsisten hasil pengukuran dengan
menggunakan alat ukur yang sama
untuk orang yang berbeda atau pada
waktu yang berbeda, tetapi kondisi yang
sama.
• Konsistensi berkaitan dengan tingkat
kesalahan hasil suatu tes yang berupa
skor.

• Contoh. Kalau kita mengukur panjang

suatu meja kayu dengan menggunakan
meteran berulang-ulang, baik dalam
tenggang waktu yang lama, bila hasil
pengukurannya sama, maka dapat
dikatakan bahwa meteran tersebut
andal atau reliable untuk mengukur
panjang meja.
• Pengukuran pada bidang pendidikan
dan psikologi tidak mudah untuk
memperoleh data yang andal, karena
ada beberapa sumber kesalahan yang
berasal dari alat ukur, yang diukur, dan
yang mengukur.

INDEK RELIABILITAS
• Indek Reliabilitas didasarkan pada

teori tes klasik.
• Teori tes klasik menyatakan bahwa
besarnya skor yang tampak
merupakan penjumlahan dari skor
murni dan kesalahan pengukuran
• Teori tes klasik dapat ditulis sebagai
berikut: X = T + E
• X = sebagai skor yang tampak
• T = sebagai skor murni
• E = sebagai kesalahan pengukuran

INTERPRESTASI RELIABILTAS

• 1. Bila Pxx = 1 , maka
a. Pengukuran tanpa kesalahan
b. Semua varians skor tampak
merefleksikan varians skor murni
c. Perbedaan diantara skor tampak
merupakan perbedaan skor murni
d. Korelasi antara skor tampak dan
skor murni sama dengan 1 ( Pxt=1 )
e. Korelasi antara skor tampak dengan
kesalahan sama dengan 0 ( Pxe=0 )

• 2. Bila Pxx = 0 , maka
a. Pengukuran berisi kesalahan random
semata – mata
b. Semua subjek, X = E
c. Semua varians skor tampak merupakan
varians keslahan
d. Semua perbedaan diantara skor tampak
mencerminkan kesalahan pengukuran
e. Korelasi antara skor tampak dan skor
murni adalah 0 , ( Pxt = 0 )
f. Korelasi antara skor tampak dan
kesalahan adalah 1 , ( Pxe = 1 )

3. Bila 0 < Pxx < 1 , Maka
a. Sebagian pengukuran mengandung
kesalahan
b. X = T + E
c. Varians skor tampak terdiri atas varians skor murni dan
varians kesalahan
d. Perbedaan diantara skor tampak mungkin
mencerminkan
perbedaan skor murni maupun kesalahan pengukuran
e. Korelasi antara skor tampak dan skor murni sama
dengan akar kuadrat koefisien reliabilitas yaitu :
Pxt = V Pxx’
f. Korelasi antara skor tampak dengan kesalahan sama
dengan akar kuadrat dari 1 dikurangi koefisien
reliabilitas
yaitu Pxe = V ( 1 – Pxx’ )
g. Semakin tinggi koefisien reliabilitas skor berarti estimasi
skor tampak X terhadap skor murni T semakin dapat
dipercaya dikarenakan varians kesalahan kecil

METODE ESTIMASI
RELIABILITAS
Estimasi reliabilitas dikategorikan menjadi
tiga yaitu metode Konsistensi internal,
Stabilitas, dan Antar penilai (inter-rater)
I. Konsistensi Internal
• Metode Konsistensi Internal yaitu metode
yang hanya memerlukan satu kali penyajian
tes saja yang dikenal dengan nama singletrial administration.
• Metode ini untuk menghindari masalah yang
timbul akibat penyajian tes yang ber ulang.
• Metode ini terdiri dari tiga yaitu: Pararel
Klasik, Tauekivalen, dan Konginerik.

a. PARAREL KLASIK
• Metode pararel klasik dimana suatu tes di bagi dua

dengan cara gasal dan genap atau bagian awal dan
bagian akhir ( split-half atau belah dua).
• Persyaratan metode ini yang harus dipenuhi yaitu
rerata bagian pertama dan kedua sama, varians kedua
belahan sama, serta materi yang diukur juga sama.
• Formula untuk menghitung besarnya indek reliabilitas
pararel klasik dengan Spearman-Brown
kp
Pxx = ----------------1+(k–1)p
K adalah jumlah item setelah ada perubahan dibagi
dengan jumlah atem awal
P adalah korelasi antara skor pada item gasal dan skor
pada item genap atau reliabilitas sebelum ada
perubahan

• Bila suatu tes atau item tes dibagi dua

dengan nomor gasal dan genap, maka
rumus Spearmen-Brown sebagai berikut:
2ry1y2
rxx = ----------------1 + ry1y2
ry1y2 = koefisien korelasi antara kedua belahan
rxx = estimasi koefisien reliabilitas keseluruhan
test X jadi bila diperoleh ry1y2=0.676 dari
kedua belahan, maka koefisien reliabilitas
tast X :
2 (0.0676)
rxx = ---------------1 + 0.676
rxx = 0.8067

b. TAU - EKIVALEN
• Pendekatan Tau-ekivalen dapat menggunakan
formula Rulon dimana estimasi belah dua
tanpa berasumsi kedua belahan mempunyai
varians yang sama.
• Formula rulon dimana varians yang perlu
diperhitungkan adalah varians kesalahan.
• Rulon menyatakan bahwa varians distribusi
perbedaan skor pada belahan-belahan tes
seluruhnya ditentukan oleh varians kesalahan
masing-masing belahan bersama-sama
membentuk varians kesalahan tes
keseluruhan.
• Varians distribusi perbedaan dapat dipakai
untuk mengestimasi reliabilitas tes.

• Formula atau rumus reliabilitas Rulon

sebagai berikut:
rxx = 1 – s2d / s2x
• Dimana
S2d = Varians distribusi perbedaan skor
kedua belahan
S2x = Varians distribusi skor total
• Bila varians X, telah diketahui S2X = 8.249,
sedangkan varians d telah diketahui S2d =
1.61
rXX = 1 – 1.61/8.249
= 1 – 0.1952
= 0.8048

• Eatimasi Koefisien Alpha (Alpha

Cronbach) digunakan bila distribusi skor
belahan Y1 dan Y2 tidak memiliki varians
yang sama atau tidak cukup alasan
bahwa kedua belahan adalah pararel.
• Formula atau rumus Alpha Cronbach:
2 ( S2X – (S2Y1 + S2Y2))
Alpha = - - - - - - - - - - - - - -- - - - - - -

S 2X
Dimana :
S2Y1 = varians skor subjek pada belahan Y j
S2X1 = varians skor pada keseluruhan test
X
a = Koefisien reliabilitas alpha

Diketahui

S2Y1 = 2.239, S2Y2 = 2.689
S2X = 8.249

2(8.249-(2.239+2.689))
Koefisien Alpha = ---------------------------8.249
= 0.805

c. KONGINERIK
• Metode ini digunakan bila varians

kedua belahan tidak sama da rerata
dua belahan juga tidak sama.
• Model pengukuran dapat ditulis
sebagai berikut: PT1T2 = 1.0
Ti2
= b12 Ti1 + C12
• Formula yang termasuk metode ini
adalah Kristoff untuk tes belahan-tiga.
Setiap belahan tidak perlu panjang
tetapi harus diasumsikan sebagai
memiliki isi yang
homogen(Congeneric).

• Formula Kristoff untuk melakukan estimasi
terhadapvarians skor murni sebagai
berikut:

S12S13 S13S23 S13S23
• S2T= ------ + ------- + ------ +2 (S12+S13+S23)
S23

S13

S12

Dimana :
S2T = Varians skor murni
Sik = Kovarians belahan Yi dan belahan Yk

• Maka rumusan reliabilitas
rXX = Sik /S2X
S = kovarians belahan Y1 dan belahan Y2

• Bila diketahui jumlah belahan Y1 = 10 Y2 =
11, dan Y3 = 12
• Penghitungan kovarians antar ketiga
belahan S12 = 0.63, S13 = 0.13, S23 = 0.61
(.63)(.13) (.63)(.61) (.13)(.61)
S2T = --------- + ---------- + ---------.61
.13
.63
+ 2 (.63+.13+.61)
S2T = 5.9563
(125)2
1645- -------Varians X, S2X =
10
-------------- = 8.25
10

Reliabilitas Test dihitung sebagai
berikut:
rXX = S2T / S2X
= 5.9563 /8.25
= 0.722

II. Stabilitas
1. Stabilitas hasil pengukuran dapat dilihat
dari besarnya korelasi skor hasil pengukuran
pertama dan hasil pengukuran kedua. Dua
distribusi skor dikorelasikan dan besarnya
korelasi sebagai indek reliabilitas yang
diartikan sebagai stabilitas pengukuran
2. Metode tes retes dilakukan dengan
menggunakan tes yang sama pada
kelompok subjek yg sama dengan
memberikan waktu yg cukup diantara dua
kali tes tersebut.
3. Menghitung korelasi antara distribusi skor
tampak kedua hasil tes akan diperoleh
koefisien reliabilitas tes yang bersangkutan.

• Koefisien korelasi sempurna diperoleh bila

setiap subjek mendapatkan skor yang sama
pada kedua tes dan bila distribusi skor
kelompok tersebut variansnya tidak sama
denganSubjek
nol. Misalnya:
Skor X1
Skor X2
1
2
3
4
5
6
7
8
9
10

40
43
39
52
50
44
44
51
48
47
Jmlh X1 = 458
Jmlh X12 = 21160
Jmlh X1 X2 =
21090

42
43
38
50
51
45
44
49
49
46
Jmlh X2 = 457
Jmlh X22 = 21037

Kofesien reliabilitas test X dihitung dengan
formulan Product Moment dari Pearson.
(Jmh X1) ( Jmh X2)
Jmh X1X2 - -----------------------N
rX1X2 = ---------------------------------------------(Jmh X1)2
(Jmh X2)2
JmhX12 - ---------- Jmh X22 - --------N
N

(458) ( 457)
21090 - -----------------10
rX1X2 = ------------------------------------------(458)2
(457)2
21160 - -------- 21037 - ---------10
10
159.400
rX1x2 = -----------------------167.109
rX1X2 = 0.954

• Metode tes-retes sangat peka terhadap

masalah efek bawaan (carry over effect)
diantara kedua penyajian skor subjek.
• Carry over effect yaitu penyajian (tes) kedua
sangat mungkin dipengaruhi oleh penyajian
(tes) yang pertama atau sebaliknya.
• Carry over effect disebabkan oleh subyek
ada waktu latihan, karena belajar, waktu
pendek, sikap subjek ( bersikap negatif,
tidak sungguh-sungguh, atau memberikan
jawaban seadanya/sekenanya)
• Tes-retes lebih cocok untuk mengestimasi
reliabilitas test yang mengukur percobaan
yang stabil selama tenggang waktu
penyajian tes dan tak mudah dipengaruhi
carry over effect.

III. Reliabiltas Antar penilai (Inter Rater )

• Pengumpulan data dilapangan bisa

pengamatan, observasi terhadap
perilaku seseorang atau karya tertulis
seseorang.
• Pengamatan dapat berupa karya tulis,
karya seni, atau tes kinerja (test
performans)
• Koefisien reliabilitas data pengamatan
menggunakan inter rater atau
konsistensi antar penilai, dan teknik
analisis menggunakan analisis varians.

• Pendekatan inter rater dapat

menggunakan pendekatan hoyt, korelasi
intraklas, teori generaliabilitas ( G theory
dan D theory), skor komposit.
• Pendekatan hoyt, dimana skor item dalam
hal ini dianggap sebagai desain faktorial
dua jalan yang dikenal dengan sebutan
treatment x subjek design
• Pendekatan hoyt dalam perhitungan
hasilnya sama dengan perhitungan dengan
formula KR 20 karena untuk item dikotomi.
• Item dikotomi adalah jawaban ya tidak,
benar salah, dan item politomi adalah
jawaban skor angka 1, 2, 3, 4, 5, dst.

• Pendekatan reliabilitas pengukuran

observasi merupakan koefisien
kesepakatan antar penilai atau
korelasi intrakelas (fernandes).
• Formula koefisien korelasi intrakelas
yaitu rasio varians skor murni dan
varians skor tampak.
• Pendekatan teori generalibilitas
terdiri atas G theory dan D theory.
• G theory digunakan untuk
mengestimasi besarnya koefisien
reliabilitas antar penilai pada
keadaan tertentu.

• Pendekatan reliabilitas skor komposit
merupakan suatu tes yang terdiri
atas beberapa subtes, bukan bentuk
paralel, tetapi mengukur hal yang
berbeda.
• Skor komposit bisa tediri dari subtes
verbal, kuantitatif, dan penalaran,
sehingga skor akhir merupakan skor
dari tiga subtes tersebut.

Selamat Belajar

Selamat Bekerja
Terima Kasih