Jurnal Evaluasi Pendidikan e-ISSN: 2443-1958 PENYETARAAN VERTIKAL TES MATEMATIKA SMP DENGAN TEORI RESPONS BUTIR MODEL RASCH
Jurnal Evaluasi Pendidikan
Volume 3, No 1, Maret 2015 (12-25) Online: http://journal.student.uny.ac.id/ojs/index.php/jep
PENYETARAAN VERTIKAL TES MATEMATIKA SMP DENGAN TEORI RESPONS BUTIR MODEL RASCH
Devi Dwi Kurniawan, Djemari Mardapi Prodi PEP PPs UNY, Universitas Negeri Yogyakarta devidwikurniawan@gmail.com, djemarimardapi@yahoo.co.id
Abstrak
Penelitian ini bertujuan untuk mengetahui: (1) karakteristik perangkat tes prestasi belajar matematika, 2) penyetaraan vertikal tes prestasi belajar matematika, 3) tingkat kemampuan matematika siswa SMP kelas VII, VIII dan IX di Kota Pekalongan. Penelitian ini menggunakan pendekatan kuantitatif. Populasi penelitian adalah respon siswa SMP di Kota Pekalongan. Data yang berupa skor diolah dan disetarakan menggunakan desain nonequivalent anchor test dengan metode penyetaraan mean & sigma berdasarkan teori respons butir model Rasch. Hasil penelitian ini adalah: (1) diperoleh tiga perangkat tes matematika memiliki tingkat kesukaran dan reliabilitas dengan kategori baik; (2) hasil penyetaraan vertikal menunjukan persamaan konversi untuk kelas VII ke kelas
VIII adalah Y* = bx + 0,369 serta persamaan konversi untuk kelas IX ke kelas VIII adalah Y* = bz + 0,337; (3) kemampuan siswa kelas VIII lebih baik dibandingkan kemampuan siswa kelas VII, dan kemampuan siswa kelas IX lebih baik dibandingkan kemampuan siswa kelas VIII.
Kata kunci: penyetaraan vertikal, tes matematika, teori responsbutir model Rasch
VERTICAL EQUATING OF MATHEMATICS TEST WITH RASCH MODEL ITEM RESPONSE THEORY
Devi Dwi Kurniawan, Djemari Mardapi Prodi PEP PPs UNY, Universitas Negeri Yogyakarta devidwikurniawan@gmail.com, djemarimardapi@yahoo.co.id
Abstract
This research aims to reveal; (1) the characteristics of the mathematics learning achievement tests, (2) the vertical equating of mathematics achievement tests, and (3) the level of mathematical ability of junior high school students of classes VII, VIII and IX in Pekalongan. The research used the quantitative approach. The population of this research was the responses of the students of junior high schools in Pekalongan. The data in the form of scores were processed and equalised using the nonequivalent anchor test with the mean and sigma equating method based on Rasch model item response theory. The results of this research are: (1) three math tests that have difficulty level good and reliability, (2) the vertical equating showing the conversion equation of class VII to VIII class is Y * = bx + 0.369, and the conversion equation of class IX to VIII class is Y * = bz + 0.337, and (3) the
ability of class VIII students better is than that of class VII, and class IX students’ability is better than that of class VIII students’.
Keywords: vertical equating, mathematics test, Rasch model item response theory
Jurnal Evaluasi Pendidikan e-ISSN: 2443-1958
Penyetaraan Vertikal Tes Matematika SMP ... Devi Dwi Kurniawan, Djemari Mardapi
Jurnal Evaluasi Pendidikan – Volume 3, No 1, Maret 2015
Pendahuluan
Pada abad 21 pendidikan menjadi fak- tor penting untuk dapat bersaing secara global. Menurut Mardapi (2012, p.12) upaya mening- katkan kualitas pendidikan dapat ditempuh melalui peningkatan kualitas pembelajaran dan kualitas sistem penilaiannya. Dengan demikian, dalam proses pendidikan di sekolah misalnya dalam pembelajaran matematika harus meng- upayakan pelaksanaan proses pembelajaran dan penilaian dengan sebaik-baiknya. Proses pem- belajaran matematika yang baik tentunya dapat dilakukan dengan memberikan keleluasaan bagi siswa untuk mengembangkan dan mengeksplo- rasi kemampuannya.
Schwartz (2005, p.1) mengemukakan keberhasilan dasar dari pendidikan matematika adalah untuk mendukung pengembangan keca- kapan di matematika dari berbagai macam kondisi kehidupan. Kecakapan matematika siswa dalam kondisi kehidupan di Sekolah dapat dilihat pada saat siswa mengikuti Tes. Pelaksanaan tes pada dasarnya untuk menilai keberhasilan siswa selama proses pembelajaran. Tes sangat perlu dilakukan agar pendidik dalam hal ini guru dapat mengetahui prestasi belajar siswanya setelah diberikan materi pelajaran dalam proses pembelajaran. Oleh sebab itu, pembuatan tes yang baik perlu diupayakan dengan mempertimbangkan kemampuan siswa, agar tes yang dilakukan sebagai alat ukur untuk menguji prestasi belajar siswa dapat mencer- minkan/menggambarkan kemampuan siswa sesungguhnya.
Tes pada mata pelajaran matematika berkaitan dengan materi matematika yang di- ajarkan dalam jenjang tertentu misalnya di Sekolah Menengah Pertama (SMP). Materi matematika bersifat berkesinambungan dan saling terkait, dimana materi yang diajarkan pada kelas sebelumnya sebagai fundasi awal untuk memperdalam serta melanjutkan dengan keterkaitan materi yang diajarkan pada kelas selanjutnya, sehingga perlu penguasaan materi yang baik oleh siswa, agar siswa dalam kelas selanjutnya dapat memahami materi dengan baik. Penguasaan materi matematika siswa dapat dilihat dari tes yang akan diujikan guru, tetapi kenyataan yang ada masih dijumpai dalam pengembangan pembuatan tes oleh guru untuk menguji penguasaan siswa kurang memperhatikan tingkat kemampuan siswa misalnya soal-soal tes matematika yang disusun untuk tes tanpa dilakukannya pengujian terlebih
dahulu untuk melihat apakah soal tersebut layak digunakan untuk tes atau tidak, sehingga kualitas tes yang dihasilkan kurang baik.
Pembuatan soal yang digunakan untuk ulangan akhir semester di Sekolah Menengah Pertama di Kota Pekalongan guru matematika yang bergabung dalam Musyawarah Guru Mata Pelajaran Matematika Kota Pekalongan harus menyusun tes dengan baik dengan memilih model tes yang akurat yang dapat mengukur kemampuan siswa dengan tepat, sehingga prestasi matematika siswa dalam penguasaan materi dapat diketahui guru dengan melihat skor yang diperoleh dalam pelaksanaan tes.
Menurut Kolen & Brennan (2004, p.5) skor dua tes yang berbeda dari dua kelompok atau lebih dapat diperbandingkan jika butir- butir soalnya setara dan memiliki skala yang sama. Proses ini dapat digambarkan jika para guru dalam melaksanakan tes di sekolah hasil skor dari tes dapat dibandingkan antar kelas maupun antar sekolah apabila tes yang diberi- kan kepada siswa setara (sama). Kesetaraan antar skor dapat dilakukan secara statistik. Suatu proses statistik yang digunakan untuk menghasilkan skala tunggal dari skor dua tes berbeda tersebut dinamakan penyetaraan atau equating (Kolen & Brennan, 1995, p.2). Se- dangkan menurut Peteson, Kolen, Hoover (da- lam Linn, 1989, p.242) mengemukakan penye- taraan adalah suatu proses empiris yang diperlu- kan untuk mentransformasi skor dari tes yang satu ke skor tes yang lain. Selanjutnya Ham- bleton, Swaminathan, Rogers (1991, p.123) menyatakan bahwa penyetaraan merupakan proses menstransformasi skor X ke matriks skor tes Y atau sebaliknya, sehingga dari hasil penyetaraan ini dapat dibandingkan. Berdasar- kan pendapat yang dikemukakan para ahli tersebut dapat diambil kesimpulan bahwa pe- nyetaraan mempunyai manfaat untuk menyama- kan hasil tes dari berbagi variansi tes berbeda yang diujikan di Sekolah.
Penyetaraan tes dapat dilakukan de- ngan dua cara yakni horisontal maupun vertikal (Crocker & Algina, 2008, p.456). Penyetaraan yang dilakukan terhadap tes yang memiliki tingkat kesulitan berbeda pada tingkat kelas yang berbeda tapi mengukur perlakuan yang sama disebut penyetaraan vertikal. Penyetaraan vertikal dapat digunakan guru untuk mengung- kap perkembangan kemampuan siswa, walau- pun siswa tersebut berada pada tingkat kelas yang berbeda dan memiliki tingkat kemampuan
Jurnal Evaluasi Pendidikan
Volume 3, No 1, Maret 2015
yang berbeda, asalkan tes yang digunakan mengukur perlakuan yang sama.
Penyetaraan vertikal pada tingkat kelas yang berbeda pada pelajaran matematika akan membantu guru memperoleh informasi tentang kemampuan siswa pada mata pelajaran ma- tematika, sehingga perkembangan kemampuan siswa dapat diamati. Hal tersebut mengisyarat- kan betapa pentingnya melakukan penyetaraan vertikal bagi sekolah sebab melalui penyetaraan vertikal dapat diperoleh informasi tentang ke- mampuan siswa dan berbagai kecenderungan- nya. Informasi tersebut akan menjadi acuan dalam usaha perbaikan menuju peningkatan kualitas hasil belajar khususnya di Sekolah Menengah Pertama di Kota Pekalongan.
Penyetaraan vertikal tes matematika dengan teori respons butir model Rasch di- lakukan di Kota Pekalongan untuk melihat seberapa besar kontribusi kebermanfaatan penyetaraan tes pada ulangan akhir semester matematika SMP di Kota Pekalongan. Rasch (1980, p.16) adalah orang pertama yang me- ngembangkan model logistik satu parameter. Pada model Rasch, orang diberi karakteristik tingkat kemampuan laten dan butir diberi karakteristik tingkat kesukaran. Probabilitas menjawab benar suatu butir adalah fungsi dari perbandingan antara tingkat kemampuan dan kesukaran butir.
Pada teori respons butir (IRT), kemam- puan laten merupakan konstruk statistik yang diperoleh dari data empiris. Pendekatan IRT menggunakan tiga informasi butir tes: taraf kesukaran, nilai daya beda butir, dan faktor ter- kaan. Model Rasch hanya menggunakan taraf kesukaran butir. Pada model tersebut probabi- litas jawaban benar naik ketika kemampuan siswa naik. Probabilitas jawaban salah naik ketika kemampuan siswa turun. Model Rasch mempunyai model ciri khusus yang tidak dimiliki model lain. Pertama, probabilitas ja- waban benar tergantung pada perbedaan antara parameter kemampuan siswa dan parameter kesukaran butir. Kedua, parameter kemampuan siswa dan parameter kesukaran butir dapat diestimasi secara terpisah. Parameter kemampu- an siswa yang diestimasi tidak bergantung pada distribusi butir tes. Parameter kesukaran butir yang diestimasi tidak bergantung pada dis- tribusi kemampuan siswa. Ketiga, skor mentah cukup untuk mengestimasi parameter kemam- puan. Keempat, luas di bawah fungsi informasi selalu konstan. Untuk jumlah kategori respons tertentu, semua butir tes memberikan sum-
bangan sama terhadap tinggi fungsi informasi sepanjang kontinum kemampuan.
Berbagai penelitian yang telah dilaku- kan tentang penyetaraan diantaranya hasil penelitian Antara (2014, p.2) yang berjudul pe- nyetaraan vertikal dengan pendekatan klasik dan IRT pada siswa sekolah dasar, menunjukan bahwa penggunaan beberapa metode penyetara- an memberikan informasi bahwa nilai kemam- puan meningkat seiring meningkatnya pering- kat kelas. Sedangkan hasil penelitian Sugeng (2010, p.289) yang berjudul penyetaraan vertikal model kredit parsial soal matematika SMP, menunjukan keakuratan penyetaraan se- makin meningkat seiring meningkatnya panjang tes. Dari hasil penelitian-penelitian tersebut menunjukan bahwa penyetaraan tes baik digu- nakan dalam mengukur prestasi belajar siswa. Berdasarkan uraian-uraian teori dan permasa- lahan-permasalan serta diperkuat hasil peneliti- an yang telah ada dapat disimpulkan bahwa dengan penyetaraan tes matematika di SMP akan dapat mengukur kemampuan siswa de- ngan lebih baik sehingga diharapkan dapat meningkatkan prestasi belajar matematika se- lama proses pembelajaran di Sekolah.
Penelitian ini bertujuan untuk menge- tahui; (1) karakteristik perangkat tes prestasi belajar matematika siswa SMP kelas VII, VIII dan IX di Kota Pekalongan yang telah disusun berdasarkan teori respons butir model Rasch, (2) penyetaraan vertikal tes prestasi belajar matematika siswa SMP kelas VII ke kelas VIII dan kelas VIII ke kelas IX di Kota Pekalongan yang telah disusun berdasarkan teori respons butir model Rasch, (3) tingkat kemampuan matematika siswa SMP kelas VII, VIII dan IX di Kota Pekalongan.
Metode Penelitian
Penelitian ini merupakan jenis pene- litian exploratif dengan pendekatan kuantitatif. Mengekplorasi kemampuan siswa dalam tes prestasi belajar matematika tingkat Sekolah Menengah Pertama (SMP).
Penelitian ini dilakukan di Kota Pekalongan, khususnya di Sekolah Menengah Pertama (SMP) di bawah naungan Dinas Pen- didikan Pemuda dan Olahraga Kota Pekalongan Tahun Pelajaran 2014/2015. Penelitian ini dilakukan pada bulan Februari 2015 – Maret 2015.
Populasi dalam penelitian ini adalah respons siswa SMP di Kota Pekalongan terha-
Penyetaraan Vertikal Tes Matematika SMP ... 15 Devi Dwi Kurniawan, Djemari Mardapi
dap tes prestasi belajar matematika. Pengam- ganda mampu mengungkap materi yang luas bilan sampel menggunakan teknik stratified
dan digunakan pada tes berskala besar. proporsional random sampling , untuk menentu-
Data diperoleh dari respons jawaban kan sekolah dan kelas yang dipilih sebagai
tes matematika siswa kelas VII, VIII, dan IX di sampel penelitian. Alasan peneliti mengguna-
SMP Kota Pekalongan Tahun Pelajaran 2014/ kan teknik ini dikarenakan populasi dalam
2015. Data respon jawaban siswa diperoleh dari penelitian ini berstrata, yaitu kelas VII, VIII,
masing-masing sekolah yang digunakan sebagai dan IX, kemudian secara proporsional diambil
sampel penelitian, yakni SMP N 2 Pekalongan, siswa pada setiap strata. Selanjutnya adalah
SMP N 5 Pekalongan, SMP N 8 Pekalongan, penentuan sekolah secara random atau acak.
SMP N 11 Pekalongan, dan SMP N 15 Peka- Langkahnya adalah mengelompokan sekolah
longan.
kedalam tiga kategori, yaitu sekolah dengan Instrumen tes matematika model kategori atas; Kategori tengah; kategori bawah.
dikotomus untuk kelas VII, VIII, dan IX SMP Hal ini diperoleh berdasarkan data dari Dinas
di Kota Pekalongan disusun berdasarkan pokok Pendidikan Pemuda dan Olahraga Kota
bahasan sesuai dengan kurikulum yang diguna- Pekalongan serta hasil diskusi dengan beberapa
kan. Ketiga perangkat tes memuat butir-butir guru matematika yang bernaung dalam Asosiasi
soal yang sama sebagai butir anchor. Banyak- Musyawarah Guru Mata Pelajaran (MGMP)
nya butir anchor ditentukan minimal 20% untuk matematika di Kota Pekalongan. Setelah strata
pilihan ganda. Dasar yang digunakan penetapan sekolah teridentifikasi dilakukan pemilihan se-
banyaknya butir anchor mengacu pada teori kolah secara acak pada setiap kategori sekolah.
bahwa banyak butir anchor minimal 20% Dalam penelitian ini siswa kelas VII, VIII, dan
(Hambleton, Swaminathan, & Rogers, 1991,
IX pada 5 sekolah terpilih akan dijadikan sam-
p.135).
pel penelitian yakni SMP Negeri 2 Pekalongan Penyusunan kisi-kisi tes bertujuan mewakili strata atas, SMP Negeri 8 Pekalongan
untuk mendiskripsikan ruang lingkup dan dan SMP Negeri 15 Pekalongan mewakili strata
tekanan tes beserta bagian-bagiannya, sehingga tengah serta SMP Negeri 5 Pekalongan dan
menjadi petunjuk efektif dalam penulisan soal. SMP Negeri 11 Pekalongan mewakili strata
Penulisan soal merupakan realisasi dari penja- bawah. Besar ukuran sampel penelitian disaji-
baran indikator dan jenis tingkah laku yang kan pada tabel 2 di bawah ini.
diukur menjadi pertanyaan-pertanyaan yang karakteristiknya sesuai dengan perincian dalam
Tabel 1. Sampel Penelitian kisi-kisi. Soal dibuat sesuai kisi-kisi tes mate- matika SMP yang telah disusun untuk masing-
Kelas
No Sekolah
masing kelas yakni kelas VII, kelas VIII, dan
VII
VIII
IX kelas IX. Dalam setiap perangkat tes mate-
1 SMP N 2 Pekalongan
95 matika terdapat 10 butir bersama (anchor).
2 SMP N 5 Pekalongan
99 80 79 Analisis kualitatif tes yang meliputi va-
3 SMP N 8 Pekalongan
liditas isi dan keterbacaan soal melibatkan ahli
dalam bidang pendidikan matematika, ahli dalam bidang pengukuran pendidikan dan ahli
4 SMP N 11 Pekalongan
5 SMP N 15 Pekalongan
72 85 62 bidang evaluasi pendidikan. Selain itu analisis
Jumlah Siswa
soal juga melibatkan guru dan beberapa siswa
Jumlah Sampel
SMP untuk mendapatkan informasi keterbacaan soal. Perangkat tes yang telah dikonsultasikan
Penelitian ini menggunakan data em- kepada para ahli direvisi dengan mempertim- piris berupa pola respon siswa yang bersifat
bangkan penilaian dan masukan-masukan dari dikotomus, sebab data dikotomus bentuk
para ahli yang telah menelaah perangkat tes. pilihan ganda lebih objektif dan handal untuk
Setelah melakukan revisi dihasilkan perangkat melihat respon siswa, tanpa dipengaruhi subjek-
tes matematika yang siap diuji cobakan. tivitas penilai. Data empiris yang digunakan
Ujicoba soal dilakukan untuk menda- yaitu, hasil tes mata pelajaran matematika SMP
patkan informasi empirik tentang karakteristik di Kota Pekalongan Tahun Ajaran 2014/2015.
butir dan kemampuan butir. Dalam ujicoba soal Selain itu, pemilihan tes bentuk pilihan ganda
dilaksanakan disalah satu SMP di Kota Pe- didasarkan pada kemampuan bentuk tes pilihan
kalongan yang bukan menjadi sampel penelitian yakni SMP IT Assalam Boarding School Peka-
Jurnal Evaluasi Pendidikan – Volume 3, No 1, Maret 2015
16 Jurnal Evaluasi Pendidikan
longan. Pelaksanaan uji coba melibatkan siswa membuat seperangkat tes, kemudian diterapkan kelas VII, kelas VIII, dan kelas IX. Hasil
pengukuran kepada peserta. Pengukuran ini analisis uji coba dianalisis menggunakan prog-
akan menampilkan hasil dalam bentuk skor. ram Winsteps untuk melihat tingkat kesukaran
Selanjutnya, bagaimana membandingkan dua dan reliabilitas tes yang telah disusun. Butir-
skor dari dua tes yang berbeda. Jadi jika dua butir soal yang tidak baik digugurkan atau
peserta masing-masing mengikuti tes berbeda, direvisi. Hasil uji coba instrumen disajikan pada
maka bagaimana cara membandingkan skor Tabel 2 berikut ini.
siswa. Hal ini dapat dilakukan dengan cara pe- nyetaraan.
Tabel 2. Hasil Uji Coba Instrumen Penelitian ini akan menyetarakan tiga perangkat tes matematika yang berbeda tingkat-
Kelas
Karakteristik nya. Perangkat tes meliputi materi kelas VII,
IX VIII, dan IX. Siswa kelas VII mengerjakan tes Jumlah Item
VII
VIII
30 30 30 X dengan butir anchor V1, kelas VIII mengerja- kan tes Y dengan anchor V1 dan V2, sedangkan
Jumlah Siswa
kelas IX mengerjakan tes Z dengan butir anchor Soal Baik
23 24 23 V2. Masing-masing paket tes terdiri dari 30 Soal di Revisi
7 6 7 butir dikotomus, sedangkan butir anchor V1 Soal Tidak Baik
dan V2 masing-masing berjumlah 10 item. Analisis data butir tes dilakukan de-
ngan pendekatan teori respons butir dengan menggunakan bantuan program Winsteps. Pe-
Berdasarkan hasil analisis terhadap uji nyetaraan tes juga dilakukan dengan pendekat- coba instrumen di atas, tidak terdapat soal yang
an teori respons butir dengan bantuan program tidak layak digunakan, hanya terdapat beberapa
Winsteps. Winsteps merupakan perangkat lunak soal yang perlu direvisi, hal ini dikarenakan
(software) yang diciptakan khusus untuk ana- hasil output analisis menunjukan bahwa semua
lisis butir soal. Program ini disusun berdasarkan item berada pada interval [-2,+2]. Hal ini sesuai
pendekatan model Rasch. Hasil analisis butir dengan yang dikemukan Hambleton &
dengan menggunakan program Winsteps mem- Swaminathan (1985, p.36) item yang baik jika
berikan informasi tentang skor, kemampuan, nilai tingkat kesukaran dalam interval [-2,+2]
indeks kesalahan pengukuran, infit, dan outfit, yang terbagi dalam tiga kategori yakni Soal
serta tingkat kesukaran baik untuk butir (item) dikategorikan sukar apabila b mendekati +2,
maupun peserta tes (person). kategori mudah apabila b sekitar -2 dan soal
dikategorikan sedang apabila -1,00 < b < +1,00. Soal-soal yang perlu dilakukan revisi yakni
Hasil Penelitian dan Pembahasan
soal-soal yang berada dalam kategori sukar dan Hasil analisis penelitian meliputi: (1) mudah. Untuk soal kelas VII yang perlu direvisi
Uji asumsi teori respons butir (2) Karakteristik yakni soal nomor 3, 4, 12, 16, 26, 27 dan 28.
perangkat tes matematika. (3) penyetaraan skor Untuk soal kelas VIII yang perlu direvisi yakni
dan skala; (4) penyetaraan kemampuan siswa. soal nomor 1, 7, 8, 13, 14 dan 26. Untuk soal
Analisis yang digunakan dalam penelitian ini kelas IX yang perlu direvisi yakni soal nomor 7,
menggunkan pendekatan teori respons butir
9, 14, 18, 20, 21 dan 25. Selanjutnya soal-soal model Rasch menggunakan bantuan program yang direvisi pada masing-masing kelas,
Winsteps.
disusun kembali dan digunakan untuk peng- ambilan data penelitian. Dari hasil uji coba juga
Uji Asumsi Teori Respons Butir diketahui keefisienan waktu yang sesuai digu-
nakan untuk menyelesaikan seperangkat tes. Uji asumsi unidimensi dilakukan untuk Desain penyetaraan vertikal tes mate-
mengetahui apakah tes yang digunakan meng- matika SMP menggunakan common-item non-
ukur satu macam kemampuan, dalam penelitian equivalent groups design atau desain tes
ini berarti mengukur kemampuan siswa SMP anchor. Penentuan butir anchor dilakukan
pada mata pelajaran matematika. Uji asumsi dengan mempertimbangkan butir yang meme-
unidimensi dilakukan melalui analisis faktor nuhi syarat dan distribusi materi soal menurut
menggunakan program SPSS statistics 21. peringkat kelas. Dalam penelitian ini, peneliti
Sebelum melakukan analisis faktor dilakukan pengujian kelayakan analisis menggunakan uji
Volume 3, No 1, Maret 2015
Penyetaraan Vertikal Tes Matematika SMP ... 17 Devi Dwi Kurniawan, Djemari Mardapi
KMO- MSA dan uji Bartlet’s pada tiap tes. Uji
9 nilai eigen yang lebih dari 1, dan pada kelas KMO-MSA digunakan untuk melihat kecukup-
IX terdapat 8 nilai eigen yang lebih dari 1, an sampel, sedangkan uji Bartlet’s untuk nor-
sehingga dikatakan bahwa dari ke 30 butir pada malitas data yang digunakan. Hasil analisis
setiap kelas tersebut dapat membentuk 8 faktor disajikan pada Tabel 3.
pada kelas VII, 9 faktor pada kelas VIII dan 8 faktor pada kelas IX. Hasil analisis juga menun-
Tabel 3. Uji Analisis Faktor Tes Kelas VII, jukan bahwa faktor 1 merupakan faktor yang
VIII, dan IX
dominan karena memiliki nilai eigen sebesar 6,460 pada kelas VII, nilai eigen sebesar 5,599
Tes KMO
Bartlett’s Test
dan nilai eigen sebesar 6,836 pada kelas IX, Kelas VII
nilai eigen faktor 1 pada setiap kelas hampir 3 Kelas VIII
kali dari nilai eigen faktor yang kedua, sehingga Kelas IX
dapat dikatakan tes matematika kelas VII, VIII, dan IX bersifat unidimensi.
Uji asumsi independensi lokal otomatis Tabel 4 menunjukan hasil analisis
terbukti, setelah dibuktikan dengan unidimen- empiris pada tes kelas VII dengan nilai KMO- sionalitas data respons peserta terhadap suatu MSA sebesar 0,917 dan nilai signifikansi uji tes (Heri Retnowati, 2014, p.7). Penjelasan ter- Bartlet sebesar 0,000. Nilai KMO-MSA yang
sebut dapat dimaknai bahwa dengan telah ter- dihasilkan dari ketiga perangkat tes kelas VII, buktinya asumsi unidimensi sehingga asumsi kelas VIII dan kelas IX sudah memenuhi syarat
indenpendensi lokal juga telah terpenuhi. untuk melakukan analisis faktor. Hal ini telah
Uji invariansi parameter bertujuan sesuai dengan syarat untuk analisis faktor untuk mengetahui apakah karakteristik item adalah KMO-MSA > 0,5 dan uji Bartlet < 0,5.
tidak berubah meskipun dijawab oleh kelompok Menurut Hambleton & Swaminathan
siswa yang berbeda. Begitu pula untuk kelom- (1985, p.16) uji unidimensi terpenuhi jika tes pok siswa yang sama, estimasi kemampuan mengukur satu dimensi yang dominan yang
tidak akan berubah meskipun item soal ber- mengukur kemampuan yang sama. Untuk
ubah-ubah. Jadi, ada dua uji invariansi parame- mendapatkan butir yang mengukur dimensi ter yakni invariansi parameter butir dan in- yang sama, dilakukan proses ekstraksi sehingga
variansi parameter kemampuan siswa. Penguji- dihasilkan beberapa faktor. Setiap faktor yang
an dilakukan menggunakan diagram pencar terbentuk memiliki nilai eigen dan faktor scree plot untuk tiap parameter butir. Hasil dengan nilai eigen di atas 1,00 dipertahankan.
invariansi parameter butir dan parameter Nilai eigen tes kelas VII, VIII dan IX dapat kemampuan kelas VII, kelas VIII dan kelas IX dilihat pada Tabel 4. dapat dilihat pada gambar 1, 2, 3, 4, 5 dan 6.
Tabel 4. Nilai Eigen Tes Matematika Kelas
VII, VIII, dan IX
y = 1,0873x - 0,0007 Jumlah
Nilai Eigen
ap
R² = 0,9221
en
Faktor
Kelas VII Kelas VIII Kelas IX
Ganjil
Gambar 1. Scree Plot Invariansi Parameter
4 1,205 Tingkat KesukaranKelas VII 1,215 1,153
7 y = 1,0491x + 2E-05 1,052 1,109 1,052 ap
R² = 0,9538
en
Ganjil
Hasil analisis faktor pada Tabel 5 di Gambar 2. Scree Plot Invariansi Parameter atas menunjukan pada kelas VII terdapat 8 nilai
Tingkat KesukaranKelas VIII eigen yang lebih dari 1, pada kelas VIII terdapat
Jurnal Evaluasi Pendidikan – Volume 3, No 1, Maret 2015
18 Jurnal Evaluasi Pendidikan
Karakteristik Perangkat Tes Matematika y = 0,8865x - 0,0006
Penelitian ini menghasilkan tiga pe-
ap
R² = 0,9441
rangkat tes matematika yang telah diuji empiris
en
secara kuantitatif dan kualitatif. Ketiga perang-
kat adalah tes matematika kelas VII, kelas VIII
Ganjil
dan kelas IX yang masing-masing berjumlah 30 butir soal.
Gambar 3. Scree Plot Invariansi Parameter Karakteristik perangkat tes matematika Tingkat KesukaranKelas IX
dianalisis dengan pendekatan teori respons butir model Rasch menggunakan bantuan program
Pada gambar 1, 2, dan 3 di atas menun- Winsteps. Hasil keluaran (output) analisis butir jukan secara keseluruhan plot menyebar pada
soal dengan program Winsteps mencakup garis diagonal. Plot yang menyebar pada garis
informasi tentang skor (score), kemampuan, diagonal berarti parameter butir tingkat ke-
dan indeks kesalahan pengukuran (standard sukaran bersifat invariansi.
error ). Tampilan lain yang disajikan oleh Win- steps adalah beberapa grafik dan tabel, terma- suk tabel konversi skor ke kemampuan. Hal ini dipilih sesuai dengan kebutuhan dalam menca-
y = 0,7092x + 0,1986
si
pai tujuan penelitian.
R² = 0,4896
im st a n butir ena
E g Tes Matematika Kelas VII
Estimasi dengan butir ganjil deng
Analisis tes matematika kelas VII meli- puti kecocokan model, parameter butir dan ciri
peserta, fungsi informasi butir dan SEM. Hasil Gambar 4. Scree Plot Invariansi Parameter analisis menggunakan program Winsteps diper- Kemampuan Kelas VII oleh beberapa informasi. Butir yang dianalisis
sebanyak 30 dan peserta 514 siswa. Butir de- ngan tingkat kesukaran paling tinggi adalah
ir
y = 0,5789x + 0,1788
but p a R² = 0,424
butir 2 dengan tingkat kesukaran 1,51 dan butir
si
paling mudah adalah butir nomor 16 dengan
im n
a g ena
tingkat kesukaran -1,13.
Est ng
Responden yang memiliki kemampuan
de Estimasi dengan butir ganjil
tertinggi pada siswa adalah peserta nomor 78 dengan kemampuan 3,63, dan peserta dengan
Gambar 5. Scree Plot Invariansi Parameter kemampuan terendah peserta nomor 406 de- Kemampuan Kelas VIII
ngan kemampuan -2,84. Pada output hasil ana- lisis pemilihan peserta yang diterima sesuai de- ngan data adalah peserta dengan outfit mean square (MNSQ) 0,5 < MNSQ < 1,5 dan nilai
y = 0,7451x + 0,1627
si
point measure correlation (Pt Mean Corr) tidak
R² = 0,5261
im st a n butir E g ena
negatif. Hasil analisis menunjukan bahwa
terdapat 29 siswa yang tidak sesuai dengan
kedua kategori.
deng
Hasil analisis menunjukan informasi yang menunjukan tingkat kesukaran, kesalahan Gambar 6. Scree Plot Invariansi Parameter
Estimasi dengan butir ganjil
pengukuran, infit, outfit dan Pt measure. Pada Kemampuan Kelas I
output hasil analisis perangkat tes kelas VII pemilihan item yang diterima sesuai dengan
Pada gambar 4, 5, dan 6 di atas menun- data adalah item dengan outfit mean square jukan secara keseluruhan plot menyebar men-
(MNSQ) 0,5 < MNSQ < 1,5 dan nilai point dekati garis diagonal. Plot yang menyebar pada
measure correlation (Pt Mean Corr) tidak nega- garis diagonal berarti parameter kemampuan
tif. Hasil analisis menunjukan bahwa terdapat 1 bersifat invariansi.
butir yang tidak sesuai dengan kategori. Butir tersebut adalah Butir nomor 9 yang memiliki
Volume 3, No 1, Maret 2015
Penyetaraan Vertikal Tes Matematika SMP ... 19 Devi Dwi Kurniawan, Djemari Mardapi
tingkat kesukaran -0,34, kesalahan pengukuran yang merespon butir memiliki kemampuan 0,10, outfit MNSQ 1,60, outfit ZSTD 7,2 dan Pt
setara dengan tingkat kesukarannya. Dengan Measure 0,12.
kata lain fungsi informasi butir maksimum Hasil analisis menunjukan kriteria ting-
ketika parameter ciri peserta θ = b i . Hasil kat kesukaran butir yang terbagi dalam tiga
perhitungan menunjukan nilai fungsi informasi kategori. Soal dikategorikan sukar apabila b
maksimum sebesar 16,4487 logit pada sekitar mendekati +2, dan kategori mudah apabila b
-0,2. SEM dalam tes ini sebesar 0,2466 SEM sekitar -2. Soal dikategorikan sedang apabila -
berbanding terbalik dengan fungsi informasi 1,00 < b < +1,00. Hasil karakteristik butir soal
tes. Hal ini berarti siswa kelas VII akan mem- perangkat tes matematika kelas VII disajikan
berikan informasi yang baik, dengan kesalahan pada Tabel 5.
pengukuran terkecil, apabila dikerjakan oleh siswa yang memiliki = -0,2. Grafik hubungan
Tabel 5. Karakteristik Butir Tes Kelas VII fungsi informasi butir dan SEM disajikan pada
Gambar 7.
Butir Tingkat Kesukaran
Gambar 7. Hubungan Fungsi Informasi Butir
Sukar
dan SEM Tes Kelas VII
Pada Gambar 7 di atas menyajikan nilai
Sedang
fungsi informasi dari suatu tes matematika
Sedang
kelas VII dengan 30 butir. Perangkat tes ini
16 -1,13
Mudah
memiliki nilai fungsi informasi yang lebih
tinggi dibandingkan kesalahan pengukuran
Sedang
pada rentang -3 sampai +3. Dengan demikian
20 -0,57
Sedang
perangkat tes ini sesuai untuk peserta tes pada
Sedang
rentang kemampuan tersebut.
22 -0,02
Sedang
Tes Matematika Kelas VIII
23 -0,33
Sedang
Hasil analisis perangkat tes matematika
24 -0,31
Sedang
kelas VIII menggunakan program Winsteps
Sedang
diperoleh beberapa informasi. Butir yang di-
Sedang
analisis sebanyak 30 dan peserta 503 siswa.
27 -1,07
Mudah
Butir dengan tingkat kesukaran paling tinggi
28 -1,01
Mudah
adalah butir 19 dengan tingkat kesukaran 1,56
29 -0,43
Sedang
dan butir paling mudah adalah butir nomor 6
30 -0,33
Sedang
dengan tingkat kesukaran -1,21. Responden yang memiliki kemampuan
Hasil analisis pada Tabel 5 di atas tertinggi pada siswa adalah peserta nomor 476 menunjukan butir soal yang dikategorikan
dengan kemampuan 3,71, dan peserta dengan mudah sebanyak 3 butir, kategori butir sedang
kemampuan terendah peserta nomor 69 dengan sebanyak 24 butir dan kategori butir sukar
kemampuan -2,09. Pada output hasil analisis sebanyak 3 butir. pemilihan peserta yang diterima sesuai dengan
data adalah peserta dengan outfit mean square Fungsi Informasi Butir Kelas VII
(MNSQ) 0,5 < MNSQ < 1,5 dan nilai point Fungsi informasi butir berguna untuk
measure correlation (Pt Mean Corr) tidak menentukan mutu perangkat tes yang terdiri
negatif. Hasil analisis menunjukan bahwa atas sejumlah butir. Pada model Rasch, fungsi
terdapat 28 siswa yang tidak sesuai dengan informasi butir tertinggi akan dicapai apabila
kedua kategori.
Jurnal Evaluasi Pendidikan – Volume 3, No 1, Maret 2015
20 Jurnal Evaluasi Pendidikan
Hasil analisis menunjukan informasi Hasil tes dapat digunakan untuk yang menunjukan tingkat kesukaran, kesalahan
menentukan penyetaraan tes anchor. Pada tes pengukuran, infit, outfit dan Pt measure. Pada
ini yang merupakan butir anchor adalah butir output hasil analisis pemilihan item yang
nomor 11 sampai 20. Oleh sebab itu yang perlu diterima sesuai dengan data adalah item dengan
diperhatikan untuk analisis lebih lanjut adalah outfit mean square (MNSQ) 0,5 < MNSQ < 1,5
butir 11 sampai dengan 20. dan nilai point measure correlation (Pt Mean
Hasil analisis diperoleh beberapa Corr) tidak negatif. Hasil analisis menunjukan
informasi untuk penyetaraan tes. Rangkuman tidak terdapat item yang tidak sesuai dengan
penyetaraan soal kelas VII dengan soal kelas kedua kategori.
VIII yang merupakan butir anchor dapat dilihat Hasil analisis menunjukan kriteria
pada Tabel 7. Selanjutnya dapat ditentukan tingkat kesukaran butir yang terbagi dalam tiga
persamaan kesetaraan antara tes anchor kelas kategori. Soal dikategorikan sukar apabila b
VII ke tes anchor kelas VIII. mendekati +2, dan kategori mudah apabila b sekitar -2. Soal dikategorikan sedang apabila -
Tabel 7. Penyetaraan Tes Anchor Kelas VII ke 1,00 < b < +1,00. Hasil karakteristik butir soal
Kelas VIII kelas VIII disajikan pada Tabel 6.
Nomor
Tes Anchor-1 Tes Anchor-1
Tabel 6. Karakteristik Butir Tes Kelas VIII
Butir
Kelas VII
Kelas VIII
0,66 Butir
Tingkat Kesukaran
Fungsi Informasi Butir Kelas VIII
Sedang
Hasil analisis dengan model Rasch
12 -0,23
Sedang
perangkat tes matematika kelas VIII memiliki
13 -0,98
Sedang
nilai fungsi informasi maksimum 15,6386 logit
pada sekitar -0,4 dan SEM sebesar 0,2529. Hal
16 -0,56
Sedang
ini berarti siswa kelas VIII akan memberikan
17 -0,68
Sedang
informasi yang baik, dengan kesalahan peng-
18 -0,09
Sedang
ukuran terkecil, apabila dikerjakan oleh siswa
Sukar
yang memiliki kemampuan sekitar -0,4. Grafik
Sukar
hubungan fungsi informasi butir dan SEM
Sedang
disajikan pada Gambar 8.
Gambar 8. Hubungan Fungsi Informasi Butir dan Hasil analisis pada Tabel 6 di atas
SEM Tes Kelas VIII menunjukan butir soal yang dikategorikan
mudah sebanyak 1 butir yakni butir 6, kategori Pada gambar 8 di atas menyajikan nilai butir sedang sebanyak 24 butir.
fungsi informasi dari suatu tes matematika kelas VIII dengan 30 butir. Perangkat tes ini
Volume 3, No 1, Maret 2015
Penyetaraan Vertikal Tes Matematika SMP ... 21 Devi Dwi Kurniawan, Djemari Mardapi
memiliki nilai fungsi informasi yang lebih Tabel 8. Karakteristik Butir Tes Kelas IX tinggi dibandingkan kesalahan pengukuran pada rentang -3 sampai +3. Dengan demikian
Butir
Tingkat Kesukaran Kriteria
perangkat tes matematika kelas VII ini sesuai
1 -0,61
Sedang
untuk peserta tes pada rentang kemampuan
Tes Matematika Kelas IX
Hasil analisis perangkat tes matematika
Sedang
kelas IX menggunakan program Winsteps di-
8 -1,22
Mudah
peroleh beberapa informasi. Butir yang diana-
9 -1,72
Mudah
lisis sebanyak 30 dan peserta 441 siswa. Butir
Sedang
dengan tingkat kesukaran paling tinggi adalah
Sedang
butir nomor 28 dengan tingkat kesukaran yakni
Sedang
1,58 dan butir paling mudah adalah butir nomor
Sukar
20 dengan tingkat kesukaran yakni -1,89.
14 -0,36
Sedang
Responden yang memiliki kemampuan
Sukar
tertinggi pada siswa adalah peserta nomor 220
Sukar
dengan kemampuan 5,07 dan peserta dengan
17 -0,41
Sedang
kemampuan terendah peserta nomor 410 de-
Sukar
ngan kemampuan -3,09. Kemampuan terendah
19 -1,13
Mudah
peserta tes disebabkan mungkin tidak dapat me-
20 -1,89
Mudah
lakukan upaya penuh pada semua butir karena
21 -0,53
Sedang
kondisi pengujian atau faktor pribadi (Jin & Sedang
22 -0,50
Wang, 2014, p.196). Pada output hasil analisis Sedang
pemilihan peserta yang diterima sesuai dengan
25 -1,16
Mudah
data adalah peserta dengan outfit mean square
26 -1,13
Mudah
(MNSQ) 0,5 < MNSQ < 1,5 dan nilai point
Sukar
measure correlation (Pt Mean Corr) tidak nega-
Sukar
tif. Hasil analisis menunjukan bahwa terdapat
Sukar
36 siswa yang tidak sesuai dengan kedua
Hasil analisis menunjukan informasi Hasil analisis pada Tabel 8 di atas me- tingkat kesukaran, kesalahan pengukuran, infit,
nunjukan butir soal yang dikategorikan mudah outfit dan Pt measure . Pada output hasil analisis
sebanyak 8 butir, kategori butir sedang se- perangkat tes matematika kelas IX pemilihan
banyak 13 butir, dan kategori butir sukar item yang diterima sesuai dengan data adalah
sebanyak 9 butir
item dengan outfit MNSQ 0,5 < MNSQ < 1,5 Hasil tes dapat digunakan untuk me- dan Pt Mean Corr tidak negatif. Hasil analisis
nentukan penyetaraan tes anchor. Kolom yang menunjukan bahwa terdapat 5 item yang tidak
digunakan untuk keperluan penyetaraan adalah sesuai dengan kedua kategori. Item tersebut
kolom nomor butir dan kolom tingkat kesukar- adalah soal nomor 8, 17, 21, 22, dan 26. Kelima
an. Pada tes ini butir yang merupakan anchor soal yang tidak sesuai kategori tersebut
item adalah butir nomor 21 sampai 30. Oleh memiliki outfit MNSQ > 1,50.
sebab itu yang perlu diperhatikan untuk analisis Hasil analisis menunjukan kriteria
lebih lanjut adalah measure butir 21 sampai tingkat kesukaran butir yang terbagi dalam tiga
dengan 30.
kategori. Soal dikategorikan sukar apabila b Hasil analisis diperoleh beberapa infor- mendekati +2, dan kategori mudah apabila b
masi untuk penyetaraan tes. Rangkuman penye- sekitar -2. Soal dikategorikan sedang apabila -
taraan soal kelas VIII dengan soal kelas IX, 1,00 < b < +1,00. Hasil karakteristik butir soal
yang merupakan anchor, dapat dilihat pada perangkat tes matematika kelas IX disajikan
Tabel 9. Selanjutnya dapat ditentukan persama- pada Tabel 9.
an kesetaraan antara tes anchor kelas VII ke tes anchor kelas VIII.
Jurnal Evaluasi Pendidikan – Volume 3, No 1, Maret 2015
22 Jurnal Evaluasi Pendidikan
Tabel 9. Penyetaraan Tes Anchor Kelas VIII Hasil penyetaraan memungkinkan melakukan
ke Kelas IX
perbandingan atau konversi antara dua kemam-
puan yang mengukur perangkat tes yang ber-
Tes Anchor-2
Tes Anchor-2
Nomor Butir Kelas IX
beda. Cara memperoleh skor yang sama, ke-
mampuan skor tes X dan Y dikonversikan pada
2 -0,50
skala utama (common score scale).
3 -0,04
Teori respon butir memiliki sifat utama
yakni invarian pada parameternya. Parameter
5 -1,16
ciri peserta adalah invarian terhadap butir,
6 -1,13
demikian pula ciri butir adalah invarian ter-
hadap peserta. Penyetaraan skala dilakukan
apabila parameter butir maupun parameter
peserta belum diketahui. Estimasi terhadap
10 -1,32
parameter ini dapat dilakukan secara linier, dengan model logistik. Pada penelitian ini
Fungsi Informasi Butir Kelas IX penentuan persamaan penyetaraan mengguna- Berdasarkan hasil analisis perangkat tes
kan rancangan tes anchor secara linear model matematika kelas IX memiliki nilai fungsi
logistik satu parameter. Pada model ini daya informasi maksimum 12,2344 logit pada sekitar
beda butir dianggap konstan, sehingga pada -0,2 dan SEM sebesar 0,2859. Hal ini berarti
persamaan konversi hanya ada satu konstanta siswa kelas IX akan memberikan informasi
penskalaan. Penyetaraan berdasarkan teori yang baik, dengan kesalahan pengukuran
respons butir menggunakan bantuan program terkecil, apabila dikerjakan oleh siswa yang
Winsteps yang mengacu pada Model Rasch. memiliki kemampuan sekitar -0,2. Grafik
Hasil perhitungan rerata terhadap hubungan fungsi informasi butir dan SEM
tingkat kesukaran tes anchor (V1), diperoleh disajikan pada gambar 9.
besaran rerata tingkat kesukaran tes yang dikerjakan oleh siswa kelas VII sebesar 0,313; dan rerata tes yang dikerjakan siswa kelas VIII sebesar 0,056. Dengan demikian konstanta translasi butir sebesar 0,369. Persamaan kon- versi tingkat kesukaran butir kelas VII ke kelas
VIII adalah: Y* = b x + 0,369
Gambar 9. Hubungan Fungsi Informasi Butir dan Misalkan butir nomor 1 tes kelas VII
SEM Tes Kelas IX memiliki b x = 0,03 maka Y* = 0,39. Hal ini sedikit berbeda dengan hasil konversi secara
Pada gambar 9 di atas menyajikan nilai langsung menggunakan program yang sebesar - fungsi informasi dari suatu tes matematika
0,69. Perbedaan sebesar -1,09 masih di bawah kelas IX dengan 30 butir. Perangkat tes ini
0,5 sehingga masih dapat diterima. Hasil memiliki nilai fungsi informasi yang lebih
penyetaraan tingkat kesukaran butir tersebut tinggi dibandingkan kesalahan pengukuran
menunjukan bahwa tingkat kesukaran butir pada rentang -3 sampai +3. Dengan demikian
kelas VII mengalami penurunan apabila dikon- perangkat tes ini sesuai untuk peserta tes pada
versi terhadap kelas VIII. Hal ini apabila tes rentang kemampuan tersebut.
kelas VII dikerjakan oleh siswa kelas VIII maka Penyetaraan Skor dan Skala
tingkat kesukarannya menjadi berkurang. Cara Penyetaraan
yang sama dapat dilakukan untuk menentukan empiris yang diperlukan untuk menstranformasi
merupakan
prosedur
penyetaraan skala tingkat kesukaran butir kelas skor suatu tes ke skor tes yang lain. Melalui
VII ke kelas VIII yang lain. proses penyetaraan yang dilakukan secara benar
Besar rerata tingkat kesukaran tes dapat diukur perkembangan dan pemetaan
anchor (V2) yang dikerjakan oleh siswa kelas berbagai kecenderungan serta mendapat dan
IX = 0,275; dan rerata tingkat kesukaran tes menggabungkan informasi dari perangkat tes
yang dikerjakan oleh siswa kelas VIII = 0,062. berbeda. Penyetaraan yang dapat mengukur
Dengan demikian konstanta translasi butir perkembangan adalah penyetaraan vertikal.
Volume 3, No 1, Maret 2015
Penyetaraan Vertikal Tes Matematika SMP ... 23 Devi Dwi Kurniawan, Djemari Mardapi
sebesar 0,337. Persamaan konversi tingkat ke- tersebut menunjukan nilai RMSD sangat kecil sukaran butir kelas IX ke kelas VIII adalah:
sehingga dapat disimpukan bahwa metode Y* = b z + 0,337
penyetaraan yang digunakan cukup baik. Pe- Misalkan butir nomor 1 tes kelas IX
nyetaraan dengan pendekatan teori respons memiliki b z = -0,61 maka Y* = -0,27. Hal ini
butir memberikan hasil penyetaraan yang lebih sedikit berbeda dengan hasil konversi secara
konsisten. Hal ini sesuai yang dikemukakan langsung menggunakan program yang sebesar -
Powers & Kolen (2014, p.1) mengemukakan 0,69. Perbedaan sebesar -0,42 masih di bawah
keakuratan hasil penyetaraan sangat penting 0,5 sehingga masih dapat diterima. Hasil penye-
ketika membandingkan skor ujian dalam bentuk taraan tingkat kesukaran butir tersebut menun-
pengujian. Hal tersebut dikarenakan dalam teori jukkan bahwa tingkat kesukaran butir kelas IX
respons butir terjadi invariansi diantara butir mengalami peningkatan apabila dikonversi
dan peserta, atau dapat dikatakan bahwa ciri terhadap kelas VIII. Hal ini apabila tes kelas IX
butir adalah invarian sekalipun pesertanya dikerjakan oleh siswa kelas VIII maka tingkat
berbeda-beda serta ciri peserta adalah invarian kesukarannya menjadi meningkat atau lebih
sekalipun butirnya berbeda-beda. sulit. Cara yang sama dapat dilakukan untuk
Penyetaraan Kemampuan Siswa menentukan penyetaraan skala tingkat kesukar-
Hasil analisis program Winsteps mem- an butir kelas IX ke kelas VIII yang lain.
perlihatkan kesetaraan antara kemampuan siswa Hasil penyetaraan dapat juga dilihat
kelas VII dengan kemampuan siswa kelas VIII. pada hasil analisis program Winsteps menun-
Hasil penyetaraan menunjukan bahwa kemam- jukkan hasil konversi antara tingkat kesukaran
puan siswa kelas VII menjadi lebih rendah butir tes kelas VII dengan kelas VIII. Hasil
setelah disesuaikan dengan skala kemampuan akhir menunjukan bahwa tingkat kesukaran
siswa kelas VIII. Hasil analisis kesetaraan an- butir tes kelas VII mengalami penurunan apa-
tara kemampuan siswa kelas IX ke kemampuan bila dikonversikan terhadap kelas VIII. Hal ini
siswa kelas VII menunjukan bahwa kemampu- berarti, apabila tes kelas VII ini dikerjakan oleh
an siswa kelas IX menjadi lebih tinggi setelah siswa kelas VIII, maka tingkat kesukarannya
disesuaikan dengan skala kemampuan siswa menjadi berkurang. Hasil akhir juga menunjuk-
kelas VIII.
kan bahwa tingkat kesukaran butir tes kelas IX Persamaan konversi untuk kemampuan mengalami peningkatan apabila dikonversikan
mengikuti persamaan konversi ciri butir. terhadap kelas VIII. Hal ini berarti, tes kelas IX
Konstanta penskalaannya sebesar 0,369 untuk ini dikerjakan oleh siswa kelas VIII, maka
konversi kemampuan kelas VII ke kelas VIII, tingkat kesukaranya menjadi lebih tinggi.
dan -0,03 untuk konversi kemampuan kelas IX Tingkat kesukaran butir yang telah
ke kelas VIII. Persamaan konversi kemampuan disetarakan skalanya dapat diperbandingkan
kelas VII ke kelas VIII adalah: satu dengan yang lain. Dengan dilakukan
θ y =θ x + 0,369
penyetaraan skala ini, dapat diketahui butir yang memiliki tingkat kesukaran paling tinggi
misalkan peserta kelas VII memiliki θ x dan paling rendah. Hasil analisis menunjukan
=- 3,59 maka θ y = -3,22. Hal ini sedikit berbeda bahwa perangkat tes kelas VII, kelas VIII, dan
dengan hasil konversi secara langsung menggu- kelas IX mempunyai tingkat kesukaran yang
nakan program yang sebesar -3,63. Perbedaan hampir sama. Hal ini ditunjukan oleh skor
sebesar 0,41 masih di bawah 0,5 sehingga rerata tingkat kesukaran perangkat tes yang
masih dapat diterima. Hasil penyetaraan tingkat telah dikonversikan dalam skala WITs yaitu
kemampuan tersebut menunjukan bahwa ting- sebesar 498,90, kelas VIII sebesar 503,25 dan
kat kemampuan siswa kelas VII mengalami kelas VII sebesar 494,00.
penurunan apabila dikonversikan terhadap ke- Penentuan keakuratan penyetaraan
mampuan siswa kelas VIII. Hal ini apabila menggunakan root mean square difference
siswa kelas VII mengerjakan tes kelas VIII (RMSD) dari nilai estimasi parameter tingkat
maka kemampuannya akan mengalami penu- kesukaran (b) sebelum dan sesudah disetarakan
runan. Cara yang sama dapat dilakukan untuk pada butir 2 diperoleh hasil analisis untuk
menentukan penyetaraan kemampuan siswa perangkat tes kelas VII sebesar 0,098, perang-
kelas VII ke kelas VIII yang lain. kat kelas VII sebesar 0,024 dan perangkat kelas
Persamaan konversi kemampuan kelas
IX ke kemampuan kelas VIII adalah: RMSD pada butir 2 pada ketiga perangkat tes
IX sebesar 0,026. Berdasarkan hasil analisis
Jurnal Evaluasi Pendidikan – Volume 3, No 1, Maret 2015
24 Jurnal Evaluasi Pendidikan
θ y *=θ z + 337 Hal lain yang mendukung hasil pene- misalkan peserta kelas IX memiliki θ litian adalah dalam pelaksanaan penelitian
dapat dilihat bahwa kelas IX lebih serius dalam =- 3,85 maka θ y = -3,51. Hal ini sedikit berbeda mengerjakan tes. Selain itu sebelum penelitian dengan hasil konversi secara langsung menggu- dilakukan, beberapa sekolah telah melaksana- nakan program yang sebesar -3,63. Perbedaan kan tes pendalaman materi untuk melihat ke- sebesar 0,12 masih di bawah 0,5 sehingga siapan siswa kelas IX dalam menghadapi ujian masih dapat diterima. Hasil penyetaraan tingkat nasional, sehingga siswa kelas IX lebih siap kemampuan tersebut menunjukan bahwa ting-
dalam mengerjakan soal.
kat kemampuan siswa kelas IX mengalami peningkatan apabila dikonversikan terhadap kemampuan siswa kelas VIII. Hal ini apabila
Simpulan dan Saran
siswa kelas IX mengerjakan tes kelas VIII maka tingkat kemampuannya akan mengalami me-
Simpulan
ningkat. Cara yang sama dapat dilakukan untuk Hasil analisis kuantitatif dengan pende- menentukan penyetaraan kemampuan siswa
katan teori respons butir model Rasch pada pe- kelas IX ke kelas VIII yang lain.
rangkat tes matematika kelas VII yang berjum- Kemampuan peserta tes yang telah
lah 30 butir terdapat kategori mudah 3 butir, disetarakan dapat diperbandingkan satu dengan
kategori sedang terdapat 24 dan kategori sukar yang lain. Dengan dilakukan penyetaraan skala