KARAKTERISTIK METODE PENYETARAAN SKOR TES UNTUK DATA DIKOTOMOS.

Dr. Nonoh Siti Aminah, M.Pd. lahir di Tasikmalaya, 1 April 1951.
Perempuan yang memiliki NIP 195104011976032001 adalah staf pengajar
pada Fakultas Keguruan dan Ilmu Pendidikan UNS. Riwayat pendidikan tinggi
adalah tahun 1980 lulus sarjana (S-1) Program Studi Pendidikan Fisika di IKIP
Negeri Jakarta untuk bidang ilmu: Ilmu Alam, lulus Magister (S-2) pada tahun
1995 Program Studi Penelitian dan Evaluasi Pendidikan di IKIP Negeri Jakarta
untuk bidang ilmu: Penelitian dan Evaluasi Pendidikan (PEP), gelar Doktor (S3) bidang ilmu: Penelitian dan Evaluasi Pendidikan (PEP) berhasil
diperolehnya dari Universitas Negeri Yogyakarta pada tahun 2011. Judul dan
ringkasan Disertasi disajikan dalam 2 (dua) versi bahasa Indonesia dan
English sebagai berikut.
KARAKTERISTIK METODE PENYETARAAN SKOR TES UNTUK DATA
DIKOTOMOS. Penelitian ini bertujuan: 1) Menemukan akurasi estimasi parameter
item pada test equating menggunakan metode Item Characteristic Curve (ICC). 2)
Menemukan sensitivitas metode linear yang terdiri atas Tucker-Levine score
method dan Levine true score method applied to observed scores serta metode
equipercentile yang terdiri atas metode Braun-Holland linear dan chained
equipercentile.
Data yang digunakan data empiris yang berasal dari pola respons siswa
peserta Ulangan Akhir Semester V Mata Pelajaran Ilmu Pengetahuan Alam (IPA)
SMP Tahun Ajaran 2009/2010. SMPN 1 Lebakwangi Kuningan, SMPN 3 Cilimus
Kuningan, dan SMPN 2 Gunungjati Cirebon. Mata Pelajaran IPA SMP terdiri atas

Fisika dan Biologi. Materi tersebut diberikan oleh dua guru yang berbeda. Materi
Fisika diberikan oleh guru yang memiliki kompetensi pada bidang Fisika, materi
Biologi diberikan oleh guru yang
memiliki
kompetensi pada bidang Biologi.
Penyetaraan menggungakan anchor test design. Anchor test bersifat external,
anchor test berfungsi sebagai pengait antara tes yang disetarakan. Item anchor
berisi 10 item materi Fisika. Banyak item pada tes A 55 item, tes B 55 item dan tes
C 50 item. Pola penyetaraan yang digunakan pola kelompok, sehingga banyak item
hasil penyetaraan berjumlah 140 item terdiri atas 10 anchor item milik bersama,
45 item berasal dari tes A, 45 item berasal dari tes B, dan 40 item berasal dari tes
C.
Hasil penelitian menunjukkan bahwa: 1) Estimasi parameter item pada
penyetaraan tes menggunakan metode Item Characteristic Curva (ICC)
menghasilkan formula indeks kesulitan item b B = 1.88bA – 0.05, dan bC = 0.23, atau
bC = 2.72 bA -0.02, dan indeks daya beda item αB = α A /1.88, dan αC = αB /1.45,
atau αC = αA /2.27. Nilai RMSD (a) sebesar 0.04873 dan nilai RMSD (b) Sebesar
0.0117. Simpulan yang diperoleh, akurasi estimasi parameter item pada test
equating menggunakan metode ICC berdasarkan nilai root mean square difference
(RMSD) pada kedua parameter item relative baik (RMSD ≤ 0.1, untuk indeks daya

beda item, dan RMSD ≤ 0.1 untuk indeks kesulitan item). 2) Secara keseluruhan,
sensitivitas berbagai metode penyetaraan berdasarkan hasil hitung RMSE ≤ 0.1,
hal ini menunjukkan sensitivitas dari berbagai metode penyetaraan tinggi.
Penyetaraan menggunakan meode linear memiliki sensitivitas yang lebih tinggi
dibandingkan dengan metode equipercentile. Sensitivitas metode penyetaraan
yang paling tinggi yaitu Tucker-Levine method. Urutan sensitivitas metode
penyetaraan dari paling tinggi sampai paling rendah yaitu 1) Tucker – Levine
method, 2) Levine method, 3) Braun – Holland linear method, 4) Chained
Equipercentile Equating method. [Kata kunci: Test equating, anchor test, external
anchor test, RMSD, RMSE.]

THE
CHARACTERISTICS
OF
TEST
EQUATING
METHODS
FOR
DICHOTOMOUS DATA. This study aims to: 1) find out the accuracy of item
parameter estimates in test equating by means of the Item Characteristic Curve

(ICC) method, and 2) find out the sensivity of the linear methods consisting of the
Tucker-Levine score method and the Levine true score method applied to observed
scores and the equipercentile methods consisting of the Braund-Holland linear
method the chained equipercentile equating method.
The data were empirical data obtained from the response patterns of the junior
high school students taking the final test of Natural Sciences in the odd semester
of the academic year of 2009/2010 in SMPN 1 Lebakwangi Kuningan, SMPN 3
Cilimus Kuningan, and SMPN 2 Gunungjati Cirebon. Natural Sciences in junior
high schools consisted of Physics and Biology. The material review was done by
two different teachers. The review of the physics materials was done by a teacher
who was competent in physics and that of the biology materials was done by
teacher who was competent in biology. The test equating employed the external
anchor test design. The anchor test served to unite the equated tests. The anchor
test consisted of 10 items. The test A had 55 items, the test B had 55 items, and
the test C had 50 items. The equating pattern employed the group pattern, so that
in the equating there were 140 items, consisting of 10 common anchor items, 45
items from tests A, 45 items from tests B, and 40 items from tests C.
The results of the study are as follows. 1) The item parameter estimate in the
test score quating by means of the Item Characteristic Curve (ICC) method yields
the formula bB= 1.88 bA- 0.05, and bC = 1.45 bB – 0.23, or bC = 2.72 bA – 0.02, and

item discrimination indeces αB = αA/ 1.88, and αC = αB / 1.45, or αC = αA / 2.72. The
values of RMSD are (a) 0.04873 and (b) 0.0117. The conclusions are that the
accuracy of the item parameter estimate in the equating by means of the ICC
method based on the values of root mean square differences (RMSD) in the two
item parameters are relatively good (RMSD ≤ 0.1 for the item discrimination index
and RMSD ≤ 0.1 for the item difficulty index). 2) In general, based on the observed
value of RMSE ≤ 0.1, the sensitivity by different equating methods is high. The
equating by the linear methods has higher sensitivity than that by the
equipercentile methods. The equating method producing the highest sensitivity is
the Tucker-Levine method. The order of the sensitivity of the equating methods
from the highest to the lowest is 1) the Tucker-Levine method, 2) the Levine
method, 3) the chained equipercentile equating method, and 4) the Braun-Holland
linear method. [Keywords: test equating, anchor test, external anchor test, RMSD,
RMSE.]