Penyetaraan Dua Perangkat Tes pada Teori Respon Butir (Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah Menengah Atas Tahun 2013)
PENYETARAAN DUA PERANGKAT TES PADA TEORI
RESPON BUTIR
(Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah
Menengah Atas Tahun 2013)
SITI HANDAYANI
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Penyetaraan Dua
Perangkat Tes pada Teori Respon Butir (Studi Kasus: Soal Ujian Nasional
Matematika IPA Sekolah Menengah Atas Tahun 2013) adalah benar karya saya
dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun
kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip
dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah
disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir
skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Agustus 2014
Siti Handayani
NIM G14100034
ABSTRAK
SITI HANDAYANI. Penyetaraan Dua Perangkat Tes pada Teori Respon Butir
(Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah Menengah Atas
Tahun 2013). Dibimbing oleh DR FARIT MOCHAMAD AFENDI, MSi dan DR
AGUS SANTOSO, MSi.
Pendidikan merupakan aspek yang dapat memperlihatkan suatu negara termasuk
kedalam kategori negara maju atau berkembang. Kondisi Negara Indonesia yang
luas, dibutuhkan sebuah perangkat evaluasi pembelajaran yang bermakna sama.
Maka dari itu, pemerintah melaksanakan Ujian Nasional.Pembuatan perangkat
UN yang sempurna paralel sangatlah sulit. Provinsi Bali mendapat rata-rata UN
MTK SMA tertinggi pada tahun 2013 sedangkan Provinsi DKI Jakarta merupakan
pusat pemerintahan yang dianggap stabil dalam hal pendidikan. Rata-rata indeks
parameter daya pembeda soal pada perangkat DKI Jakarta lebih rendah daripada
Bali. Perangkat tes Bali lebih mudah daripada perangkat tes DKI Jakarta. Ratarata peluang menebak benar soal DKI Jakarta dan Bali hampir sama yakni sebesar
0.243 dan 0.221. Nilai tengah parameter kemampuan peserta tes DKI Jakarta tidak
berbeda dengan Bali. Ketika kemampuan peserta yang sama-sama sebesar nol
skor yang didapatkan DKI Jakarta sebesar 22.8 akan setara dengan skor 34.2 di
Bali.
Kata kunci: Penyetaraan Tes, Teori Respon Butir
ABSTRACT
SITI HANDAYANI. Equating Score of Two Equipment Test on Item Response
Theory (Case of Study: National Exam of Science Mathematic Senior High
School Year 2013). Supervised by DR FARIT MOCHAMAD AFENDI, MSi dan
DR AGUS SANTOSO, MSi.
Education is one of aspect that can show whether a country is developed or
developing country. In a big country such as Indonesia, it is necessary to have a
learing evaluation equipment which has the same meaning. Thus, the goverment
held a National Test. The making of National Test equipment is hard. Average
score of national test on math in Bali Province is the highest in the country on
2013 however, the region that many considered stable in term of education, DKI
Jakarta, has a lower average score. Estimated from three parametes, such as
discriminating power, difficulty level, and probability of correct response carried
out to these two equipment. Average of index from discriminating power showed
that equipment on DKI Jakarta is lower than in Bali. Difficulty level in Bali is
lower than DKI Jakarta. Average of probability of correct response in Bali and
DKI Jakarta almost indicate the similarity that is 0.243 and 0.221. In theta is zero,
score DKI Jakarta is 22.8 and equivalent to score 34.2 in Bali.
Keyword: Item Response Theory, Test Equating
PENYETARAAN DUA PERANGKAT TES PADA TEORI
RESPON BUTIR
(Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah
Menengah Atas Tahun 2013)
SITI HANDAYANI
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika
pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
Judul Skripsi : Penyetaraan Dua Perangkat Tes pada Teori Respon Butir (Studi
Kasus: Soal Ujian Nasional Matematika IPA Sekolah Menengah
Atas Tahun 2013)
Nama
: Siti Handayani
NIM
: G14100034
Disetujui oleh
Dr Farit Mochamad Afendi, MSi
Pembimbing I
Diketahui oleh
Dr Anang Kurnia, MSi
Ketua Departemen
Tanggal Lulus:
Dr Agus Santoso, MSi
Pembimbing II
PRAKATA
Puji dan syukur Penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih dalam penelitian yang dilaksanakan sejak bulan Mei 2014 ini ialah
pendidikan, dengan judul Penyetaraan Dua Perangkat Tes pada Teori Respon
Butir (Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah Menengah Atas
Tahun 2013).
Karya ilmiah ini Penulis susun sebagai salah satu kewajiban yang harus
dipenuhi dan merupakan syarat untuk mendapatkan gelar Sarjana Statistika
(SStat) pada Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan
Alam, Institut Pertanian Bogor.
Penulisan karya ilmiah ini dapat diselesaikan oleh Penulis tidak lepas dari
dukungan, bimbingan, dan bantuan banyak pihak yang sangat berarti bagi Penulis.
Oleh karena itu, Penulis mengucapkan terimakasih atas segala bantuan dan
bimbingan yang diberikan kepada Bapak Dr Farit Mochamad Afendi, MSi selaku
pembimbing pertama yang tiada lelah untuk membimbing, memberikan
pembelajaran, dan mengingatkan agar selesai tepat waktu. Tak lupa juga
terimakasih kepada Bapak Dr Agus Santoso, MSi selaku pembimbing kedua yang
selalu memberikan masukan dan pembelajaran di setiap penulisan karya ilmiah
ini. Di sisi lain, terimakasih kepada teman-teman Departemen Statistika tahun
2010 yang selalu mendukung hingga terselesaikannya karya ilmiah ini tepat waktu
serta orang tua Penulis yang senantiasa menanti kelulusan Penulis.
Semoga karya ilmiah ini bermanfaat.
Bogor, Agustus 2014
Siti Handayani
DAFTAR ISI
DAFTAR TABEL
DAFTAR GAMBAR
DAFTAR LAMPIRAN
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
2
TINJAUAN PUSTAKA
2
Teori Respon Butir
2
Pendugaan Parameter
3
Penyetaraan Tes
4
Rancangan Tes Jangkar
4
Metode Rerata Sigma
5
METODE
6
Sumber Data
6
Prosedur Analisis data
6
HASIL DAN PEMBAHASAN
6
Deskripsi Skor UN MTK IPA SMA dari Kedua Perangkat
6
Asumsi Teori Respon Butir
8
Pendugaan Parameter pada Teori Respon Butir
8
Penyetaraan Kedua Perangkat
SIMPULAN DAN SARAN
10
13
Simpulan
13
Saran
13
DAFTAR PUSTAKA
13
RIWAYAT HIDUP
17
LAMPIRAN
15
DAFTAR TABEL
1. Uji Beda Satu Arah Tingkat Kesukaran Kedua Perangkat Tes
2. Uji Beda Kemampuan Peserta dari Kedua Provinsi
9
10
DAFTAR GAMBAR
1. Histogram Skor UN MTK IPA SMA Provinsi Bali
6
2. Histogram Skor UN MTK IPA SMA Provinsi DKI Jakarta
7
3. Boxplot Skor Butir jangkar UN MTK SMA Provinsi Bali dan DKI
Jakarta
7
4. Boxplot skor Tanpa butir Jangkar UN MTK SMA Povinsi Bali dan DKI
Jakarta
8
5. Grafik Daya Pembeda Bali dan DKI Jakarta
9
6. Grafik Penyetaraan Tes Bali Terhadap DKI Jakarta
11
7. Daya Pembeda Kedua Perangkat setelah disetarakan
11
8. Tingkat Kesukaran Kedua Perangkat Setelah Disetarakan
12
9. Peluang Menebak Kedua Perangkat Setelah Disetarakan
12
DAFTAR LAMPIRAN
1. Daya Pembeda (a), Tingkat Kesukaran (b), dan Peluan Menebak (c)
Provinsi DKI Jakarta dan Bali
15
PENDAHULUAN
Latar Belakang
Pendidikan merupakan aspek yang sangat penting dalam kehidupan
berbangsa dan bernegara. Bab 1 Pasal 1 UU No 20 Tahun 2003 memaparkan
bahwa pendidikan adalah usaha sadar dan terencana untuk mewujudkan suasana
belajar dan proses pembelajaran agar peserta didik secara aktif mengembangkan
potensi dirinya untuk memiliki kekuatan spritual keagamaan, pengendalian diri,
kepribadian, kecerdasan, akhlak mulia, serta ketrampilan yang diperlukan dirinya,
masyarakat, bangsa dan negara. Sistem pendidikan dapat memperlihatkan suatu
negara termasuk kedalam kategori negara maju atau berkembang
Negara Indonesia merupakan negara kepulauan terbesar di dunia dengan
luas 5193250 km2 (mencakup daratan dan lautan) yang menjadikannya berada di
urutan ke-7 sebagai negara terluas di dunia. Kementrian Pertahanan Republik
Indonesia mencatat terdapat 17504 pulau di Indonesia. Untuk membandingkan
pendidikan antar sekolah yang sangat banyak jumlahnya dan tersebar di seluruh
pulau, dibutuhkan satu perangkat evaluasi yang bermakna sama secara nasional.
Bermula pada tahun 1980, pemerintah memberlakukan Evaluasi Belajar Tahap
Akhir Nasional (Ebtanas) yang mengembangkan perangkat ujian paralel untuk
setiap mata pelajaran yang diujikan. Secara berangsur, Ebtanas berubah nama dan
ketentuan. Pada tahun 2010 hingga sekarang evaluasi pembelajaran nasional
bernama Ujian Nasional (UN). Pemerintah menjelaskan dalam PP No 19 Tahun
2005 tentang Standar Nasional Pendidikan, tepatnya pada bab 1 pasal 1 poin ke20 dinyatakan bahwa ujian adalah kegiatan yang dilakukan untuk mengukur
pencapaian kompetensi peserta didik sebagai pengakuan prestasi belajar dan atau
penyelesaian dari suatu satuan pendidikan. Kemudian, pada bab 10 pasal 63
disebutkan standar penilaian pendidikan yang diklasifikasikan kepada 3 kriteria,
yaitu (1) penilaian hasil belajar oleh pendidik, (2) penialaian hasil belajar oleh
satuan pendidikan, dan (3) penilaian hasil belajar oleh pemerintah. Khusus pada
kriteria ketiga, dalam PP ini dijelaskan secara lebih spesifik lagi dalam pasal 66
butir 1 dinyatakan bahwa penilaian hasil belajar sebagaimana dimaksud dalam
pasal 63 ayat 1 butir c bertujuan untuk menilai pencapaian kompetensi lulusan
secara nasional pada mata pelajaran tertentu dalam kelompok mata pelajaran ilmu
pengetahuan teknologi dan dilakukan dalam bentuk Ujian Nasional (UN).
Pembuatan perangkat UN dilakukan pada masing-masing provinsi dan
melalui tahapan uji coba sedemikian rupa sehingga perangkat layak untuk
dijadikan perangkat tes yang bertaraf nasional. Terdapat 5 soal yang dibuat
terpusat sebagai butir jangkar pada seluruh paket. Dimulai pada tahun 2013,
terdapat sebanyak 20 paket soal tersebar di setiap provinsi.Namun, membuat
perangkat tes yang sempurna paralel tidaklah mudah. Masih saja terdapat
kekurangan pada masalah keadilan. Bisa jadi, perangkat di Provinsi X lebih
mudah atau lebih sulit daripada perangkat tes di Provinsi Y. Hal tersebut menjadi
kendala ketika penilaian UN dijadikan suatu patokan tertentu.
Provinsi Bali merupakan Provinsi dengan rata-rata nilai UN tertinggi pada
tahun 2013 dan tahun-tahun sebelumnya. Sedangkan Provinsi DKI Jakarta
merupakan pusat pemerintahan yang dianggap paling stabil dalam hal pendidikan.
2
Oleh karena itu, pendugaan parameter soal UN untuk mata pelajaran matematika
IPA SMA di Provinsi Bali dan Provinsi DKI Jakarta serta penyetaraan kedua
perangkat tes dengan menggunakan Teori Respon Butir merupakan topik yang
menarik untuk diambil pada penelitian ini.
Tujuan Penelitian
Tujuan yang ingin dicapai dari penelitian ini adalah menduga parameter soal
UN matematika IPA SMA di Provinsi DKI Jakarta dan Provinsi Bali serta
melakukan penyetaraan kedua perangkat tersebut.
TINJAUAN PUSTAKA
Teori Respon Butir
Teori respon butir merupakan suatu pengkajian terhadap tes dan skor butir
yang didasarkan pada asumsi-asumsi yang berkaitan antara parameter butir tes
(yang tercermin dalam jawaban-jawaban butir tes) dan kemampuan. Hambelton et
al (1991) menjelaskan bahwa model teori respon butir memiliki beberapa asumsi
diantaranya Unidimensional atau satu dimensi. Asumsi ini dipenuhi dengan syarat
adanya satu komponen yang dianggap dominan dalam menentukan kemampuan
peserta tes. Pemeriksaan asumsi ini dapat dilakukan dengan melihat rasio akar ciri
yang pertama dan kedua.Jika rasionya tinggi, maka model bersifat unidimensi
Kemudian, Independensi local atau kebebasan lokal. Kebebasan lokal pada butir
terpenuhi jika untuk menjawab butir satu dan yang lainnya tidak memiliki
hubungan dalam suatu perangkat. Hal tersebut bermakna bahwa untuk menjawab
satu butir tidak bergantung dengan butir yang lainnya. Asumsi kebebasan lokal
akan terpenuhi jika asumsi unidimensi sudah terpenuhi.
Terdapat tiga model pada teori respon butir yang sering digunakan saat ini,
yaitu:
1. Model satu parameter logistik dengan penitikberatan pada parameter tingkat
kesukaran saja. Kurva karakteristik butir pada model ini diberikan dengan
persamaan:
Pi(θ) =
Keterangan:
Pi( ) = peluang peserta tes dengan kemampuan sebesar menjawab butir
soal ke- i dengan benar
= parameter kemampuan peserta tes
bi
= parameter tingkat kesukaran
2. Model dua parameter logistik dengan penitikberatan pada parameter tingkat
kesukaran dan daya pembeda soal. Kurva karaketeristik butir pada model ini
diberikan dengan persamaan:
3
Pi(θ) =
Keterangan:
Pi( ) = peluang peserta tes dengan kemampuan sebesar menjawab butir
soal ke- i dengan benar
= parameter kemampuan peserta tes
bi
= parameter tingkat kesukaran
ai
= parameter daya pembeda soal butir ke- i
3. Model tiga parameter logistik degan penitikberatan pada parameter tingkat
kesukaran, daya pembeda soal, dan peluang menebak peserta tes. Kurva
karakteristik butir pada model ini diberikan dengan persamaan:
Pi(θ) = Ci + (1-Ci)
Keterangan:
Pi( ) = peluang peserta tes dengan kemampuan sebesar menjawab butir
soal ke- i dengan benar
= parameter kemampuan peserta tes
bi
= parameter tingkat kesukaran
ai
= parameter daya pembeda soal butir ke- i
ci
= peluang tebakan benar butir ke- i
D
= faktor penskalaan yang diikutkan untuk menjadikan fungsi logistik
serupa mungkin dengan fungsi ogive normal (D=1.7) (Thorpe et al
2012)
Pendugaan Parameter
Pendugaan kemampuan peserta tes pada dua perangkat dilakukan dengan
menggunakan pendugaan parameter kemungkinan maksimum (maximum
likelihood estimation, MLE). Hogg et al (1978) memaparkan bahwa prinsip dasar
dari metode MLE adalah ketika terdapat contoh acak X1, X2, ….,Xn dari sebuah
. Fungsi
sebaran yang memiliki suatu fungsi kepekatan peluang f(x; ),
kepekatan peluang bersama dari X1, X2,…,Xn adalah f(x1; ),f(x2; ),…f(xn; ).
Fungsi kepekatan peluang bersama ini dipandang sebagai fungsi dari .
Berdasarkan definisi yang telah dijelaskan, maka fungsi nisbah kemungkinan
dapat dinotasikan sebagai berikut:
L( ;x1,x2,…xn) = f(x1; )f(x2; )…f(xn; )
Hambelton et al (1991) mendefinisikan fungsi likelihood untuk model teori
respon butir adalah sebagai berikut:
L(x1,x2,…,xn | ) =
l(X | ) = ln L(x1,x2,…,xn | )
l(X | ) = ln
l(X | ) =
4
dengan = 0, = ( ; a, b, c)
sehingga a, b, c adalah parameter butir soal, dan adalah parameter kemampuan
peserta tes. Model ini merupakan model 3 parameter logistik.
Penyetaraan Tes
Naga (1992) menyatakan bahwa skor tes sebagai hasil koreksi dari setiap
butir yang dikerjakan peserta tes yang menampilkan jawaban benar atau salah
dibedakan menjadi dua, yaitu skor tunggal yaitu skor satu butir sebagai jawaban
dari satu peserta tes dan skor komposit yaitu gabungan dari skor tunggal
Crocker dan Algina (1986) memaparkan bahwa penyetaraan didefinisikan
sebagai suatu proses untuk menetapkan skor-skor equivalen pada dua instrumen.
Penyetaraan skor adalah suatu prosedur empiris yang diperlukan untuk
mentransformasi skor suatu perangkat tes ke skor perangkat tes yang lain. Karena
merupakan prosedur empiris maka penyetaraan skor didasarkan pada data skor tes.
Dalam buku Fundamental of Item Response Theory (Hambleton et al 1991)
Lord (1980) mengemukakan gagasan atau ide penyetaraan dalam beberapa
implikasi, diantaranya:
1. Pengukuran tes dengan sifat yang berbeda tidak dapat di setarakan.
2. Skor mentah pada tes yang konsisten tidak sama, tidak dapat diproses.
3. Skor mentah pada tes dengan kesukaran yang bervariasi tidak dapat
disetarakan karena tes tidak akan konsisten sama pada tingkat kesukaran yang
sama.
4. Kekeliruan atau kesalahan skor pada tes atau paket Y dan X tidak dapat
disetarakan kecuali jika kedua test tersebut benar-benar paralel.
5. Tes yang sempurna reliabilitasnya dapat dilakukan penyetaraan.
Penyetaraan dilakukan dengan cara mengkonversikan satu paket ke paket
yang lain, dari paket yang mengukur kemampuan yang sama. Penyetaraan
perangkat tes merupakan pembuatan sejumlah keputusan dari skor yang diperoleh
dari sebuah paket untuk disesuaikan ke bentuk yang berbeda tingkat kesukarannya.
Jika ada paket X lebih sukar dari paket Y, maka penyetaraan paket X ke Y
menghasilkan nilai paket X lebih tinggi atau berharga jika disetarakan ke paket Y
(Crocker dan Algina 1986).
Membuat soal yang setara dalam dua buah paket atau lebih, tentunya tidak
mudah atau bahkan tidak mungkin, karena pasti ada perbedaannya.Hal tersebut
disebabkan karena hampir tidak mungkin menyusun multi paket tes yang benarbenar paralel (Petersen, Kolen, & Hoover 1989). Meskipun penyusun tes
menggunakan spesifikasi tes yang sama dalam menulis butir-butirnya dan hanya
merubah angka, tidak ada jaminan bahwa tingkat kesukaran butir-butir tersebut
akan sama. Apalagi jika yang berbeda adalah kata kunci dan isi dari pilihan
jawaban.
Rancangan Tes Jangkar
Desain ini biasanya digunakan jika masalah keamanan tes menjadi salah
satu pertimbangan penting dan memungkinkan untuk menyelenggarakan beberapa
tes dalam satu waktu. Pada desain ini masing-masing perangkat tes mempunyai
5
beberapa item yang sama(common item) dan masing-masing kelompok
mengerjakan perangkat tes yang berbeda.
Crocker dan Algina (1986) memaparkan bahwa pada rancangan ini, bila
digunakan dua perangkat tes yaitu X dan Y dan dua kelompok peserta yaitu K1
dan K2, masing-masing ditambahkan butir-butir jangkar (butir yang sama) Z,
maka masing-masing kelompok mengerjakan soal X+Z dan Y+Z.
Persamaan penyetaraan skor pada rancangan ini dapat dihitung dengan
perhitungan sebagai berikut:
b*k2 = bk1+
a*k2 =
c*k2 = ck1
θ*k2 = αθk1 + β
Keterangan:
b*k2 = parameter tingkat kesukaran butir tes jangkar pada kelompok 2
a*k2 = parameter daya pembeda butir tes jangkar pada kelompok 2
c*k2 = parameter peluang menebak butir tes jangkar pada kelompok 2
θ*k2 = parameter kemampuan peserta tes jangkar pada kelompok 2
bk1
= parameter tingkat kesukaran butir tes jangkar kelompok 1
ak1
= parameter daya pembeda butir tes jangkar kelompok 1
ck1
= parameter daya pembeda buir tes jangkar kelompok 1
θk1
= parameter kemampuan peserta tes jangkar pada kelompok 1
α,β
= konstanta konversi penyetaraan tes
Metode Rerata Sigma
Penentuan konstanta konversi a dan b menurut metode rerata dan sigma dilakukan
dengan memperhatikan nilai estimasi parameter tingkat kesukaran butir tes pada
kedua perangkat tes yaitu bx dan by. Metode rerata dan sigma ini bersifat timbal
balik sehingga dengan cara yang sama hubungan dari y ke x dapat ditentukan.
Menurut Hambleton & Swaminathan 1985, hubungan antara estimasi
parameter butir tes atau parameter kemampuan peserta pada kedua perangkat tes
yang akan disetarakan dan penentuan konstanta konversinya memenuhi
persamaan sebagai berikut:
y = x+
=
+
=
-
Keterangan:
y = estimasi kemampuan atau estimasi parameter butir pada perangkat tes Y
x = estimasi kemampuan atau estimasi parameter butir pada perangkat tes X
= rerata dari y
= rerata dari x
sx = simpangan baku dari x
sy = simpangan baku dari y
6
METODE
Sumber Data
Penelitian ini menggunakan data sekunder status respon Ujian Nasional
SMA yang dilaksanakan pada 18 April 2013 untuk mata pelajaran Matematika
IPA Provinsi DKI Jakarta paket F05 dan Provinsi Bali paket C09 dengan format 1
0 (sudah di koreksi benar salahnya). Jumlah soal terdiri dari 40 butir diantaranya 5
butir jangkar (butir yang sama) dan 35 butir berbeda dari kedua perangkat. Data
diambil dari Pusat Penilaian Pendidikan, Jakarta Pusat.Jumlah peserta tes yang
diambil adalah 887 peserta di Provinsi Bali dan 1118 di Provinsi DKI Jakarta.
Prosedur Analisis data
Tahapan-tahapan yang dilakukan pada penelitian ini adalah sebagai berikut:
1. Persiapan data dan melakukan eksplorasi data.
2. Menduga parameter tingkat kesukaran (b), daya pembeda (a), dan peluang
menebak (c) untuk kedua perangkat tes.
3. Menduga parameter kemampuan peserta tes untuk kedua kelompok peserta.
4. Menghitung konstanta persamaan penyetaraan dengan metode rerata sigma.
5. Membuat persamaan penyetaraan skor kedua perangkat tes.
6. Mengkonversi skor Bali terhadap DKI.
7. Interpretasi.
HASIL DAN PEMBAHASAN
Deskripsi Skor UN MTK IPA SMA dari Kedua Perangkat
Skor UN MTK IPA SMA dari kedua provinsi memiliki rata-rata nilai yang
hampir sama. Namun, Bali memiliki rata-rata nilai yang lebih tinggi dari pada
DKI Jakarta.
Gambar 1 Histogram Skor UN MTK IPA SMA Provinsi Bali
7
Gambar 2 Histogram Skor UN MTK IPA SMA Provinsi DKI Jakarta
Sebaran skor dari kedua perangkat terlihat berbeda pada gambar histogram.
Histogram skor UN MTK IPA SMA di Provinsi DKI Jakarta lebih berbentuk
menyerupai genta (lonceng) yang menandakan kenormalan data sedangkan
histogram skor di Provisi Bali lebih curam di sebelah kanan. Hal ini menunjukkan
bahwa banyaknya peserta UN MTK SMA di Bali yang mendapat skor tinggi.
Terdapat 26.606% peserta UN MTK SMA di Provinsi Bali memperoleh skor
sebesar sama dengan lebih dari 90. Sedangkan terdapat 12.245% peserta di
Provinsi DKI Jakarta yang memeperoleh skor sama dengan lebih dari 90.
Gambar 3 Boxplot Skor Butir jangkar UN MTK SMA Provinsi Bali dan DKI
Jakarta
8
Gambar 4 Boxplot skor Tanpa butir Jangkar UN MTK SMA Povinsi Bali dan
DKI Jakarta
Rata-rata skor butir jangkar UN MTK SMA di Provinsi Bali lebih kecil
daripada di Provinsi DKI Jakarta yakni sebesar 66.448 dan 80.501. Jika dilihat
dari tiga puluh lima soal lain tanpa butir jangkar, Bali memiliki rata-rata skor yang
lebih tinggi daripada DKI Jakarta yaitu 72.613 dan 64.546. Hal demikian
menimbulkan dugaan bahwa perangkat Bali lebih mudah daripada DKI Jakarta
atau kemampuan peserta di Provinsi DKI Jakarta lebih tinggi daripada peserta di
Provinsi Bali.
Asumsi Teori Respon Butir
Asumsi Unidimensi
Teori respon butir dapat dilakukan ketika asumsi yang ada telah terpenuhi.
Asumsi unidimendional terpenuhi ketika dua akar ciri pertama dari respon peserta
memiliki rasio yang besar. Karena keterbatasan data yang didapat, maka peneliti
tidak dapat melakukan pemeriksaan asumsi ini. Akan tetapi, asumsi unidimensi
sudah di periksa ketika uji coba pembuatan perangkat soal. Maka dari itu, dapat
disimpulkan bahwa kedua perangkat tes sudah memenuhi asumsi unidimensi.
Asumsi Kebebasan Lokal
Ketika asumsi unidimensi sudah terpenuhi, maka asumsi kebebasan lokal
diperoleh. (Lord 1980) Maka dari itu, dapat disimpulkan bahwa respon dari
perangkat tes DKI Jakarta dan Bali sudah memenuhi asumsi kebebasan lokal baik
butir maupun peserta tes.
Pendugaan Parameter pada Teori Respon Butir
Model teori respon butir yang digunakan dalam penelitian ini adalah tiga
parameter logistik. Parameter butir yang diduga dari kedua perangkat tes ini
adalah daya pembeda butir, tingkat kesukaran butir, peluang menebak, dan
kemampuan peserta tes. Pada proses perhitungan dengan software, terdapat dua
butir dari kedua perangkat tes tidak keluar hasil nya. Hal tersebut dikarenakan
9
status respon yang benar semua. Pada Provinsi Bali butir nomer 24 dan 34 serta
pada Provinsi DKI Jakarta butir nomer 20 dan 29.
Daya Pembeda
Daya pembeda butir selalu bernilai positif. Semakin tinggi nilai daya
pembeda maka semakin baik pula butir soal. Daya pembeda butir
mengindikasikan dapat atau tidaknya suatu butir membedakan peserta yang
memiliki kemampuan pendidikan yang tinggi dan yang kurang. Daya pembeda
paling tinggi pada perangkat Bali terdapat pada butir nomer 10 dan pada
perangkat DKI Jakarta pada butir nomer 34. Nilai tengah daya pembeda pada
perangkat Bali lebih tinggi daripada DKI Jakarta yakni sebesar 3.58 dan 2.43.
Daya pembeda yang berkisar lebih dari 1.70 merupakan daya pembeda yang
sangat tinggi yang mengndikasikan bahwa butir soal sudah sangat baik
membedakan kategori peserta yang berkemampuan tinggi dan rendah. (Baker
1985)
12
10
8
DKI
6
BALI
4
2
0
1
3
5
7
9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39
Gambar 5 Grafik Daya Pembeda Bali dan DKI Jakarta
Tingkat Kesukaran
Tingkat kesukaran butir merupakan nilai kemampuan peserta ketika peluang
peserta menjawab benar adalah sebesar 0.5. Hal ini berarti nilai tingkat kesukaran
yang tertinggi merupakan kemampuan tertinggi yang dikerahkan untuk
mempunyai peluang menjawab butir soal dengan benar sebesar 50%. (Humbelton
et al 1991)
Tabel 1 Uji Beda Satu Arah Tingkat Kesukaran Kedua Perangkat Tes
Bali
DKI
Jakarta
N
Mean
StDev
38
-0.699
1.377
38
-0.169
1.034
Thitung
Ttabel
-0.076
1.66-1.67
10
Hipotesis nol dari uji beda satu arah ini adalah nilai tengah indeks tingkat
kesukaran di Provinsi Bali tidak lebih kecil daripada DKI Jakarta. Statistik uji t
yang dihitung lebih kecil daripada statistika uji t pada tabel. Maka dari itu,
kesimpulan yang didapat dari uji beda satu arah ini pada taraf nyata 5% adalah
nilai tengah indeks tingkat kesukaran Bali tidak lebih kecil daripada DKI Jakarta
berarti bahwa perangkat tes pada Provinsi Bali tidak lebih sulit daripada DKI
Jakarta.
Peluang Menebak Peserta untuk Menjawab Benar
Peluang menebak peserta ini dikenal sebagai Pseudo-chance-level parameter.
Peluang menebak peserta UN MTK SMA Bali dan DKI Jakarta untuk menjawab
benar hampir mendekati nilai yang sama yakni 0.221 dan 0.243. Peluang menebak
peserta untuk menjawab benar berkaitan dengan performa butir dan pilihan
jawaban.
Kemampuan Peserta Tes
Pada perangkat tes Provinsi Bali, kemampuan peserta berkisar antara -2,92
sampai 1,59 sedangkan di Provinsi DKI Jakarta, kemampuan peserta berada pada
kisaran -2,54 sampai 2,18.
Tabel 2 Uji Beda Kemampuan Peserta dari Kedua Provinsi
Provinsi
Mean
StDev
DKI Jakarta
0.004
0.982
Bali
-0.025
1.009
p value
0.507
Hipotesis nol dari uji beda dua arah ini adalah nilai tengah parameter
kemampuan peserta tes di Provinsi Bali tidak berbeda dengan nilai tengah
parameter kemampuan peserta tes di Provinsi DKI Jakarta. Setelah dilakukan
pengujian dengan menggunakan sebesar 5% didapat p-value sebesar 0.507 dan
dapat disimpulkan bahwa nilai tengah parameter kemampuan peserta tes di
Provinsi Bali tidak berbeda dengan nilai tengah parameter kemampuan peserta tes
di Provinsi DKI Jakarta.
Penyetaraan Kedua Perangkat
Perhitungan konstanta α dan β dilakukan menggunakan software yang
kemudian diperoleh hasil 0.36 dan -0.49.
11
Gambar 6 Grafik Penyetaraan Tes Bali Terhadap DKI Jakarta
Tes DKI Jakarta yang dianggap sebagai tes 1 dijelaskan oleh garis hitam, tes
Bali dijelaskan oleh garis hitam putus-putus. Garis berwarna merah merupakan
hasil penyetaraan skor Bali terhadap DKI Jakarta. Garis berwarna biru merupakan
butir jangkar dari kedua tes. Butir jangkar DKI jakarta dijelaskan oleh garis biru
biasa sedangkan butir jangkar Bali dijelaskna oleh garis biru putus-putus.
Ketika kemampuan peserta DKI Jakarta sebesar nol mendapatkan skor
sekitar 22.8, lebih rendah daripada skor yang didapat peserta Bali dengan
kemampuan yang sama. Pada hasil penyetaraan yang ditunjukkan oleh garis
merah, dengan kemampuan peserta yang sama-sama sebesar nol skor yang
didapatkan DKI Jakarta sebesar sekitar 22.8 akan setara dengan skor sekitar 34.2
di Bali. Keadaan berbeda ditunjukkan ketika kemampuan peserta berada pada
selang -5 sampai -3. Skor yng dihasilkan menunjukkan angka yang hampir sama.
Pergerakan naik dan turun skor yang didapat dari kedua tes terlihat tidak stabil
pada kemampuan peserta pada selang -3 sampai 0. Pada interval kemampuan 2
sampai 5 skor yang didapat sudah stabil posisinya.
Gambar 7 Daya Pembeda Kedua Perangkat setelah disetarakan
12
Gambar 8 Tingkat Kesukaran Kedua Perangkat Setelah Disetarakan
Gambar 9 Peluang Menebak Kedua Perangkat Setelah Disetarakan
Ketiga gambar tersebut merupakan hasil parameter butir jangkar yang telah
dilakukan penyetaraan. Butir jangkar yang ada sebenarnya adalah 5 butir. Namun
untuk butir nomor 29 pada perangkat DKI Jakarta tidak keluar parameter butir nya,
maka butir jangkar yang dimasukkan hanya 4 butir yakni nomor 10, 12, 17, dan
23.
13
Pada daya pembeda baru hasil penyetaraan hanya terlihat tiga butir. Hal
tersebut dikarenakan satu butir lainnya memiliki indeks daya pembeda yang lebih
dari 3 dan plot yang ditampilkan hanya berkisar hingga 3.
SIMPULAN DAN SARAN
Simpulan
Pendugaan ketiga parameter yakni daya pembeda, tingkat kesukaran, dan
peluang menebak dilakukan terhadap kedua perangkat tes. Rata-rata indeks
parameter daya pembeda soal pada perangkat DKI Jakarta lebih rendah daripada
Bali. Perangkat tes Bali lebih mudah daripada perangkat tes DKI Jakarta. Ratarata peluang menebak benar soal DKI Jakarta dan Bali hampir sama yakni sebesar
0.243 dan 0.221. Nilai tengah parameter kemampuan peserta tes DKI Jakarta tidak
berbeda dengan Bali yang berarti bahwa kemampuan peserta DKI Jakarta dan Bali
tidak berbeda. Ketika kemampuan peserta yang sama-sama sebesar nol skor yang
didapatkan DKI Jakarta sebesar 22.8 akan setara dengan skor 34.2 di Bali.
Saran
Penelitian ini masih terdapat banyak kekurangan, maka dari itu untuk
penelitian selanjutnya disarankan agar mencoba semua model teori respon butir
untuk keseluruhan perangkat.Selain itu, perangkat yang disetarakan diambil dari
beberapa provinsi yang latar belakang pendidikannya sangat timpang.Diusahakan
agar mendapatkan data hasil jawaban peserta secara lengkap bukan hanya status
respon hasil pemeriksaan agar lebih memudahkan untuk analisis apapun.
DAFTAR PUSTAKA
Crocker L, Algina J. 1986. Introduction to classical and modern test theory. New
York(US): Holt, Rinehart and Winston, Inc.
Davier, A. 2009. Statistical Models for Test Equating, Scaling, and Linking.
Newyork(US): Springer.
Hambleton RK, Swaminathan H, Jane RH.1991. Fundamentals of Item Response
Theory. London(GB): SagePublications.
Hogg RV, Mckean JW, AT Craig. 1978. Introduction to Mathematical Statistics
4th Edition. New York(US): Macmillan Publishing.
Lord, FM. 1980. Application of Item Response Theory to Practocal Testing
Problems. Erlbaum Associate.
Naga, DS. 1992. Pengantar Teori Skor Pada Pengukuran Pendidikan.
Jakarta(ID): Besbats
Peterson NS, Kolen M J. 1989. Scalling, Norming, and Equating. In R. L. Linn
(Ed), Educational Measurement. New York(US): Macmillan
14
Thorpe GL, Favia A. 2012. Data Analysis Using Item Response Theory
Methodology: an Introduction to Selected Program and Aplication
[Psychology Faculty Scholarship Paper 20]. Main(US): University of Maine.
Wijaya, YS. 2013. Comparison of Item Difficulty Index National Exam Package
(Analysis Using Item response Theory).Jakarta(ID): Universitas Negeri
Jakarta
15
Lampiran 1 Daya Pembeda (a), Tingkat Kesukaran (b), dan Peluan Menebak (c)
Provinsi DKI Jakarta dan Bali
NOMOR
BUTIR
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
DKI JAKARTA
a
b
c
1.827
-1.488
0.149
1.581
1.069
0.278
0.829
-0.396
0.136
1.345
-1.341
0.179
2.514
0.587
0.403
1.028
0.278
0.186
2.054
-1.486
0.113
0.644
-2.324
0.158
1.412
-1.252
0.168
0.805
-0.111
0.187
1.441
-1.510
0.146
2.306
-0.551
0.248
1.351
-1.101
0.228
1.879
-1.295
0.235
1.614
-1.401
0.199
3.230
0.202
0.330
2.074
-1.262
0.145
5.788
0.537
0.328
2.946
1.709
0.195
1.626
0.832
1.327
4.996
0.963
5.699
4.942
2.491
-1.494
0.489
-0.991
0.686
0.798
0.144
0.693
0.867
0.127
0.133
0.250
0.243
0.274
0.410
0.356
0.287
3.848
1.348
4.801
0.585
5.932
4.127
0.729
-1.335
0.808
-1.055
0.746
0.524
0.314
0.169
0.267
0.181
0.394
0.253
a
1.345
6.881
2.111
1.860
4.202
1.644
2.362
5.143
0.502
9.807
2.133
1.794
6.195
2.037
1.734
2.293
1.705
8.269
5.100
1.571
0.964
7.059
0.976
BALI
b
-2.269
0.443
-1.783
-1.213
0.148
-1.363
-1.281
0.502
-0.070
0.504
-1.851
-1.953
0.618
-1.883
-2.438
-1.136
-1.847
0.646
0.182
-1.912
-2.302
0.151
0.589
c
0.199
0.097
0.144
0.173
0.354
0.120
0.214
0.397
0.244
0.165
0.183
0.182
0.331
0.192
0.179
0.080
0.189
0.201
0.251
0.161
0.161
0.321
0.199
5.818
1.304
4.809
4.275
5.494
8.413
1.852
5.318
1.857
0.063
-5.750
0.291
0.143
0.202
0.150
-1.852
0.292
-1.261
0.219
0.200
0.295
0.184
0.146
0.313
0.200
0.259
0.134
3.821
0.771
0.243
16
DKI JAKARTA
BALI
NOMER
BUTIR
a
b
c
a
b
36
3.446
0.566
0.304
5.124
0.438
37
2.396 -0.110
0.365
0.947 -1.850
38
4.364
0.795
0.237
4.257
0.621
39
1.206
0.678
0.377
2.435
0.409
40
0.796
1.154
0.285
2.703
0.265
Keterangan:
Butir jangkar (butir yang sama) dari kedua perangkat
c
0.272
0.162
0.252
0.409
0.394
Butir yang output nya tidak keluar karena status respon yang benar
semua
17
RIWAYAT HIDUP
Penulis dilahirkan di Bogor pada 5 Februari 1993 dan merupakan anak
ketiga dari tiga bersaudara pasangan (alm.)Saefudin dan Siti Masitoh.
Penulis menyelesaikan pendidikan dasar di SD Pertiwi pada tahun 2004,
pendidikan menengah pertama di SMP Negeri 1 Bogor pada tahun 2007,
pendidikan menengah atas di SMA Negeri 4 Bogor pada tahun 2010. Penulis
diterima di Institut pertanian Bogor pada tahun 2010 melalui jalur Undangan
Seleksi Masuk IPB (USMI) dan tercatat sebagai mahasiswa Departemen
Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam dengan minor Ilmu
konsumen.
Selama perkuliahan, penulis mengikuti beberapa kegiatan non akademik
seperti organisasi MAX!! dan Gamma Sigma Beta dan menjabat beberapa posisi.
Penulis juga mengikuti beberapa kepanitiaan dan yang terahir adalah kepanitiaan
the 8th Statistika Ria.
Penulis mengikuti praktik lapang di Dinas Kependudukan dan Pencatatan
Sipil Provinsi DKI Jakarta pada bulan Juli-Agustus 2013 selama dua bulan.
RESPON BUTIR
(Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah
Menengah Atas Tahun 2013)
SITI HANDAYANI
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Penyetaraan Dua
Perangkat Tes pada Teori Respon Butir (Studi Kasus: Soal Ujian Nasional
Matematika IPA Sekolah Menengah Atas Tahun 2013) adalah benar karya saya
dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun
kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip
dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah
disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir
skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Agustus 2014
Siti Handayani
NIM G14100034
ABSTRAK
SITI HANDAYANI. Penyetaraan Dua Perangkat Tes pada Teori Respon Butir
(Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah Menengah Atas
Tahun 2013). Dibimbing oleh DR FARIT MOCHAMAD AFENDI, MSi dan DR
AGUS SANTOSO, MSi.
Pendidikan merupakan aspek yang dapat memperlihatkan suatu negara termasuk
kedalam kategori negara maju atau berkembang. Kondisi Negara Indonesia yang
luas, dibutuhkan sebuah perangkat evaluasi pembelajaran yang bermakna sama.
Maka dari itu, pemerintah melaksanakan Ujian Nasional.Pembuatan perangkat
UN yang sempurna paralel sangatlah sulit. Provinsi Bali mendapat rata-rata UN
MTK SMA tertinggi pada tahun 2013 sedangkan Provinsi DKI Jakarta merupakan
pusat pemerintahan yang dianggap stabil dalam hal pendidikan. Rata-rata indeks
parameter daya pembeda soal pada perangkat DKI Jakarta lebih rendah daripada
Bali. Perangkat tes Bali lebih mudah daripada perangkat tes DKI Jakarta. Ratarata peluang menebak benar soal DKI Jakarta dan Bali hampir sama yakni sebesar
0.243 dan 0.221. Nilai tengah parameter kemampuan peserta tes DKI Jakarta tidak
berbeda dengan Bali. Ketika kemampuan peserta yang sama-sama sebesar nol
skor yang didapatkan DKI Jakarta sebesar 22.8 akan setara dengan skor 34.2 di
Bali.
Kata kunci: Penyetaraan Tes, Teori Respon Butir
ABSTRACT
SITI HANDAYANI. Equating Score of Two Equipment Test on Item Response
Theory (Case of Study: National Exam of Science Mathematic Senior High
School Year 2013). Supervised by DR FARIT MOCHAMAD AFENDI, MSi dan
DR AGUS SANTOSO, MSi.
Education is one of aspect that can show whether a country is developed or
developing country. In a big country such as Indonesia, it is necessary to have a
learing evaluation equipment which has the same meaning. Thus, the goverment
held a National Test. The making of National Test equipment is hard. Average
score of national test on math in Bali Province is the highest in the country on
2013 however, the region that many considered stable in term of education, DKI
Jakarta, has a lower average score. Estimated from three parametes, such as
discriminating power, difficulty level, and probability of correct response carried
out to these two equipment. Average of index from discriminating power showed
that equipment on DKI Jakarta is lower than in Bali. Difficulty level in Bali is
lower than DKI Jakarta. Average of probability of correct response in Bali and
DKI Jakarta almost indicate the similarity that is 0.243 and 0.221. In theta is zero,
score DKI Jakarta is 22.8 and equivalent to score 34.2 in Bali.
Keyword: Item Response Theory, Test Equating
PENYETARAAN DUA PERANGKAT TES PADA TEORI
RESPON BUTIR
(Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah
Menengah Atas Tahun 2013)
SITI HANDAYANI
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika
pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
Judul Skripsi : Penyetaraan Dua Perangkat Tes pada Teori Respon Butir (Studi
Kasus: Soal Ujian Nasional Matematika IPA Sekolah Menengah
Atas Tahun 2013)
Nama
: Siti Handayani
NIM
: G14100034
Disetujui oleh
Dr Farit Mochamad Afendi, MSi
Pembimbing I
Diketahui oleh
Dr Anang Kurnia, MSi
Ketua Departemen
Tanggal Lulus:
Dr Agus Santoso, MSi
Pembimbing II
PRAKATA
Puji dan syukur Penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih dalam penelitian yang dilaksanakan sejak bulan Mei 2014 ini ialah
pendidikan, dengan judul Penyetaraan Dua Perangkat Tes pada Teori Respon
Butir (Studi Kasus: Soal Ujian Nasional Matematika IPA Sekolah Menengah Atas
Tahun 2013).
Karya ilmiah ini Penulis susun sebagai salah satu kewajiban yang harus
dipenuhi dan merupakan syarat untuk mendapatkan gelar Sarjana Statistika
(SStat) pada Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan
Alam, Institut Pertanian Bogor.
Penulisan karya ilmiah ini dapat diselesaikan oleh Penulis tidak lepas dari
dukungan, bimbingan, dan bantuan banyak pihak yang sangat berarti bagi Penulis.
Oleh karena itu, Penulis mengucapkan terimakasih atas segala bantuan dan
bimbingan yang diberikan kepada Bapak Dr Farit Mochamad Afendi, MSi selaku
pembimbing pertama yang tiada lelah untuk membimbing, memberikan
pembelajaran, dan mengingatkan agar selesai tepat waktu. Tak lupa juga
terimakasih kepada Bapak Dr Agus Santoso, MSi selaku pembimbing kedua yang
selalu memberikan masukan dan pembelajaran di setiap penulisan karya ilmiah
ini. Di sisi lain, terimakasih kepada teman-teman Departemen Statistika tahun
2010 yang selalu mendukung hingga terselesaikannya karya ilmiah ini tepat waktu
serta orang tua Penulis yang senantiasa menanti kelulusan Penulis.
Semoga karya ilmiah ini bermanfaat.
Bogor, Agustus 2014
Siti Handayani
DAFTAR ISI
DAFTAR TABEL
DAFTAR GAMBAR
DAFTAR LAMPIRAN
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
2
TINJAUAN PUSTAKA
2
Teori Respon Butir
2
Pendugaan Parameter
3
Penyetaraan Tes
4
Rancangan Tes Jangkar
4
Metode Rerata Sigma
5
METODE
6
Sumber Data
6
Prosedur Analisis data
6
HASIL DAN PEMBAHASAN
6
Deskripsi Skor UN MTK IPA SMA dari Kedua Perangkat
6
Asumsi Teori Respon Butir
8
Pendugaan Parameter pada Teori Respon Butir
8
Penyetaraan Kedua Perangkat
SIMPULAN DAN SARAN
10
13
Simpulan
13
Saran
13
DAFTAR PUSTAKA
13
RIWAYAT HIDUP
17
LAMPIRAN
15
DAFTAR TABEL
1. Uji Beda Satu Arah Tingkat Kesukaran Kedua Perangkat Tes
2. Uji Beda Kemampuan Peserta dari Kedua Provinsi
9
10
DAFTAR GAMBAR
1. Histogram Skor UN MTK IPA SMA Provinsi Bali
6
2. Histogram Skor UN MTK IPA SMA Provinsi DKI Jakarta
7
3. Boxplot Skor Butir jangkar UN MTK SMA Provinsi Bali dan DKI
Jakarta
7
4. Boxplot skor Tanpa butir Jangkar UN MTK SMA Povinsi Bali dan DKI
Jakarta
8
5. Grafik Daya Pembeda Bali dan DKI Jakarta
9
6. Grafik Penyetaraan Tes Bali Terhadap DKI Jakarta
11
7. Daya Pembeda Kedua Perangkat setelah disetarakan
11
8. Tingkat Kesukaran Kedua Perangkat Setelah Disetarakan
12
9. Peluang Menebak Kedua Perangkat Setelah Disetarakan
12
DAFTAR LAMPIRAN
1. Daya Pembeda (a), Tingkat Kesukaran (b), dan Peluan Menebak (c)
Provinsi DKI Jakarta dan Bali
15
PENDAHULUAN
Latar Belakang
Pendidikan merupakan aspek yang sangat penting dalam kehidupan
berbangsa dan bernegara. Bab 1 Pasal 1 UU No 20 Tahun 2003 memaparkan
bahwa pendidikan adalah usaha sadar dan terencana untuk mewujudkan suasana
belajar dan proses pembelajaran agar peserta didik secara aktif mengembangkan
potensi dirinya untuk memiliki kekuatan spritual keagamaan, pengendalian diri,
kepribadian, kecerdasan, akhlak mulia, serta ketrampilan yang diperlukan dirinya,
masyarakat, bangsa dan negara. Sistem pendidikan dapat memperlihatkan suatu
negara termasuk kedalam kategori negara maju atau berkembang
Negara Indonesia merupakan negara kepulauan terbesar di dunia dengan
luas 5193250 km2 (mencakup daratan dan lautan) yang menjadikannya berada di
urutan ke-7 sebagai negara terluas di dunia. Kementrian Pertahanan Republik
Indonesia mencatat terdapat 17504 pulau di Indonesia. Untuk membandingkan
pendidikan antar sekolah yang sangat banyak jumlahnya dan tersebar di seluruh
pulau, dibutuhkan satu perangkat evaluasi yang bermakna sama secara nasional.
Bermula pada tahun 1980, pemerintah memberlakukan Evaluasi Belajar Tahap
Akhir Nasional (Ebtanas) yang mengembangkan perangkat ujian paralel untuk
setiap mata pelajaran yang diujikan. Secara berangsur, Ebtanas berubah nama dan
ketentuan. Pada tahun 2010 hingga sekarang evaluasi pembelajaran nasional
bernama Ujian Nasional (UN). Pemerintah menjelaskan dalam PP No 19 Tahun
2005 tentang Standar Nasional Pendidikan, tepatnya pada bab 1 pasal 1 poin ke20 dinyatakan bahwa ujian adalah kegiatan yang dilakukan untuk mengukur
pencapaian kompetensi peserta didik sebagai pengakuan prestasi belajar dan atau
penyelesaian dari suatu satuan pendidikan. Kemudian, pada bab 10 pasal 63
disebutkan standar penilaian pendidikan yang diklasifikasikan kepada 3 kriteria,
yaitu (1) penilaian hasil belajar oleh pendidik, (2) penialaian hasil belajar oleh
satuan pendidikan, dan (3) penilaian hasil belajar oleh pemerintah. Khusus pada
kriteria ketiga, dalam PP ini dijelaskan secara lebih spesifik lagi dalam pasal 66
butir 1 dinyatakan bahwa penilaian hasil belajar sebagaimana dimaksud dalam
pasal 63 ayat 1 butir c bertujuan untuk menilai pencapaian kompetensi lulusan
secara nasional pada mata pelajaran tertentu dalam kelompok mata pelajaran ilmu
pengetahuan teknologi dan dilakukan dalam bentuk Ujian Nasional (UN).
Pembuatan perangkat UN dilakukan pada masing-masing provinsi dan
melalui tahapan uji coba sedemikian rupa sehingga perangkat layak untuk
dijadikan perangkat tes yang bertaraf nasional. Terdapat 5 soal yang dibuat
terpusat sebagai butir jangkar pada seluruh paket. Dimulai pada tahun 2013,
terdapat sebanyak 20 paket soal tersebar di setiap provinsi.Namun, membuat
perangkat tes yang sempurna paralel tidaklah mudah. Masih saja terdapat
kekurangan pada masalah keadilan. Bisa jadi, perangkat di Provinsi X lebih
mudah atau lebih sulit daripada perangkat tes di Provinsi Y. Hal tersebut menjadi
kendala ketika penilaian UN dijadikan suatu patokan tertentu.
Provinsi Bali merupakan Provinsi dengan rata-rata nilai UN tertinggi pada
tahun 2013 dan tahun-tahun sebelumnya. Sedangkan Provinsi DKI Jakarta
merupakan pusat pemerintahan yang dianggap paling stabil dalam hal pendidikan.
2
Oleh karena itu, pendugaan parameter soal UN untuk mata pelajaran matematika
IPA SMA di Provinsi Bali dan Provinsi DKI Jakarta serta penyetaraan kedua
perangkat tes dengan menggunakan Teori Respon Butir merupakan topik yang
menarik untuk diambil pada penelitian ini.
Tujuan Penelitian
Tujuan yang ingin dicapai dari penelitian ini adalah menduga parameter soal
UN matematika IPA SMA di Provinsi DKI Jakarta dan Provinsi Bali serta
melakukan penyetaraan kedua perangkat tersebut.
TINJAUAN PUSTAKA
Teori Respon Butir
Teori respon butir merupakan suatu pengkajian terhadap tes dan skor butir
yang didasarkan pada asumsi-asumsi yang berkaitan antara parameter butir tes
(yang tercermin dalam jawaban-jawaban butir tes) dan kemampuan. Hambelton et
al (1991) menjelaskan bahwa model teori respon butir memiliki beberapa asumsi
diantaranya Unidimensional atau satu dimensi. Asumsi ini dipenuhi dengan syarat
adanya satu komponen yang dianggap dominan dalam menentukan kemampuan
peserta tes. Pemeriksaan asumsi ini dapat dilakukan dengan melihat rasio akar ciri
yang pertama dan kedua.Jika rasionya tinggi, maka model bersifat unidimensi
Kemudian, Independensi local atau kebebasan lokal. Kebebasan lokal pada butir
terpenuhi jika untuk menjawab butir satu dan yang lainnya tidak memiliki
hubungan dalam suatu perangkat. Hal tersebut bermakna bahwa untuk menjawab
satu butir tidak bergantung dengan butir yang lainnya. Asumsi kebebasan lokal
akan terpenuhi jika asumsi unidimensi sudah terpenuhi.
Terdapat tiga model pada teori respon butir yang sering digunakan saat ini,
yaitu:
1. Model satu parameter logistik dengan penitikberatan pada parameter tingkat
kesukaran saja. Kurva karakteristik butir pada model ini diberikan dengan
persamaan:
Pi(θ) =
Keterangan:
Pi( ) = peluang peserta tes dengan kemampuan sebesar menjawab butir
soal ke- i dengan benar
= parameter kemampuan peserta tes
bi
= parameter tingkat kesukaran
2. Model dua parameter logistik dengan penitikberatan pada parameter tingkat
kesukaran dan daya pembeda soal. Kurva karaketeristik butir pada model ini
diberikan dengan persamaan:
3
Pi(θ) =
Keterangan:
Pi( ) = peluang peserta tes dengan kemampuan sebesar menjawab butir
soal ke- i dengan benar
= parameter kemampuan peserta tes
bi
= parameter tingkat kesukaran
ai
= parameter daya pembeda soal butir ke- i
3. Model tiga parameter logistik degan penitikberatan pada parameter tingkat
kesukaran, daya pembeda soal, dan peluang menebak peserta tes. Kurva
karakteristik butir pada model ini diberikan dengan persamaan:
Pi(θ) = Ci + (1-Ci)
Keterangan:
Pi( ) = peluang peserta tes dengan kemampuan sebesar menjawab butir
soal ke- i dengan benar
= parameter kemampuan peserta tes
bi
= parameter tingkat kesukaran
ai
= parameter daya pembeda soal butir ke- i
ci
= peluang tebakan benar butir ke- i
D
= faktor penskalaan yang diikutkan untuk menjadikan fungsi logistik
serupa mungkin dengan fungsi ogive normal (D=1.7) (Thorpe et al
2012)
Pendugaan Parameter
Pendugaan kemampuan peserta tes pada dua perangkat dilakukan dengan
menggunakan pendugaan parameter kemungkinan maksimum (maximum
likelihood estimation, MLE). Hogg et al (1978) memaparkan bahwa prinsip dasar
dari metode MLE adalah ketika terdapat contoh acak X1, X2, ….,Xn dari sebuah
. Fungsi
sebaran yang memiliki suatu fungsi kepekatan peluang f(x; ),
kepekatan peluang bersama dari X1, X2,…,Xn adalah f(x1; ),f(x2; ),…f(xn; ).
Fungsi kepekatan peluang bersama ini dipandang sebagai fungsi dari .
Berdasarkan definisi yang telah dijelaskan, maka fungsi nisbah kemungkinan
dapat dinotasikan sebagai berikut:
L( ;x1,x2,…xn) = f(x1; )f(x2; )…f(xn; )
Hambelton et al (1991) mendefinisikan fungsi likelihood untuk model teori
respon butir adalah sebagai berikut:
L(x1,x2,…,xn | ) =
l(X | ) = ln L(x1,x2,…,xn | )
l(X | ) = ln
l(X | ) =
4
dengan = 0, = ( ; a, b, c)
sehingga a, b, c adalah parameter butir soal, dan adalah parameter kemampuan
peserta tes. Model ini merupakan model 3 parameter logistik.
Penyetaraan Tes
Naga (1992) menyatakan bahwa skor tes sebagai hasil koreksi dari setiap
butir yang dikerjakan peserta tes yang menampilkan jawaban benar atau salah
dibedakan menjadi dua, yaitu skor tunggal yaitu skor satu butir sebagai jawaban
dari satu peserta tes dan skor komposit yaitu gabungan dari skor tunggal
Crocker dan Algina (1986) memaparkan bahwa penyetaraan didefinisikan
sebagai suatu proses untuk menetapkan skor-skor equivalen pada dua instrumen.
Penyetaraan skor adalah suatu prosedur empiris yang diperlukan untuk
mentransformasi skor suatu perangkat tes ke skor perangkat tes yang lain. Karena
merupakan prosedur empiris maka penyetaraan skor didasarkan pada data skor tes.
Dalam buku Fundamental of Item Response Theory (Hambleton et al 1991)
Lord (1980) mengemukakan gagasan atau ide penyetaraan dalam beberapa
implikasi, diantaranya:
1. Pengukuran tes dengan sifat yang berbeda tidak dapat di setarakan.
2. Skor mentah pada tes yang konsisten tidak sama, tidak dapat diproses.
3. Skor mentah pada tes dengan kesukaran yang bervariasi tidak dapat
disetarakan karena tes tidak akan konsisten sama pada tingkat kesukaran yang
sama.
4. Kekeliruan atau kesalahan skor pada tes atau paket Y dan X tidak dapat
disetarakan kecuali jika kedua test tersebut benar-benar paralel.
5. Tes yang sempurna reliabilitasnya dapat dilakukan penyetaraan.
Penyetaraan dilakukan dengan cara mengkonversikan satu paket ke paket
yang lain, dari paket yang mengukur kemampuan yang sama. Penyetaraan
perangkat tes merupakan pembuatan sejumlah keputusan dari skor yang diperoleh
dari sebuah paket untuk disesuaikan ke bentuk yang berbeda tingkat kesukarannya.
Jika ada paket X lebih sukar dari paket Y, maka penyetaraan paket X ke Y
menghasilkan nilai paket X lebih tinggi atau berharga jika disetarakan ke paket Y
(Crocker dan Algina 1986).
Membuat soal yang setara dalam dua buah paket atau lebih, tentunya tidak
mudah atau bahkan tidak mungkin, karena pasti ada perbedaannya.Hal tersebut
disebabkan karena hampir tidak mungkin menyusun multi paket tes yang benarbenar paralel (Petersen, Kolen, & Hoover 1989). Meskipun penyusun tes
menggunakan spesifikasi tes yang sama dalam menulis butir-butirnya dan hanya
merubah angka, tidak ada jaminan bahwa tingkat kesukaran butir-butir tersebut
akan sama. Apalagi jika yang berbeda adalah kata kunci dan isi dari pilihan
jawaban.
Rancangan Tes Jangkar
Desain ini biasanya digunakan jika masalah keamanan tes menjadi salah
satu pertimbangan penting dan memungkinkan untuk menyelenggarakan beberapa
tes dalam satu waktu. Pada desain ini masing-masing perangkat tes mempunyai
5
beberapa item yang sama(common item) dan masing-masing kelompok
mengerjakan perangkat tes yang berbeda.
Crocker dan Algina (1986) memaparkan bahwa pada rancangan ini, bila
digunakan dua perangkat tes yaitu X dan Y dan dua kelompok peserta yaitu K1
dan K2, masing-masing ditambahkan butir-butir jangkar (butir yang sama) Z,
maka masing-masing kelompok mengerjakan soal X+Z dan Y+Z.
Persamaan penyetaraan skor pada rancangan ini dapat dihitung dengan
perhitungan sebagai berikut:
b*k2 = bk1+
a*k2 =
c*k2 = ck1
θ*k2 = αθk1 + β
Keterangan:
b*k2 = parameter tingkat kesukaran butir tes jangkar pada kelompok 2
a*k2 = parameter daya pembeda butir tes jangkar pada kelompok 2
c*k2 = parameter peluang menebak butir tes jangkar pada kelompok 2
θ*k2 = parameter kemampuan peserta tes jangkar pada kelompok 2
bk1
= parameter tingkat kesukaran butir tes jangkar kelompok 1
ak1
= parameter daya pembeda butir tes jangkar kelompok 1
ck1
= parameter daya pembeda buir tes jangkar kelompok 1
θk1
= parameter kemampuan peserta tes jangkar pada kelompok 1
α,β
= konstanta konversi penyetaraan tes
Metode Rerata Sigma
Penentuan konstanta konversi a dan b menurut metode rerata dan sigma dilakukan
dengan memperhatikan nilai estimasi parameter tingkat kesukaran butir tes pada
kedua perangkat tes yaitu bx dan by. Metode rerata dan sigma ini bersifat timbal
balik sehingga dengan cara yang sama hubungan dari y ke x dapat ditentukan.
Menurut Hambleton & Swaminathan 1985, hubungan antara estimasi
parameter butir tes atau parameter kemampuan peserta pada kedua perangkat tes
yang akan disetarakan dan penentuan konstanta konversinya memenuhi
persamaan sebagai berikut:
y = x+
=
+
=
-
Keterangan:
y = estimasi kemampuan atau estimasi parameter butir pada perangkat tes Y
x = estimasi kemampuan atau estimasi parameter butir pada perangkat tes X
= rerata dari y
= rerata dari x
sx = simpangan baku dari x
sy = simpangan baku dari y
6
METODE
Sumber Data
Penelitian ini menggunakan data sekunder status respon Ujian Nasional
SMA yang dilaksanakan pada 18 April 2013 untuk mata pelajaran Matematika
IPA Provinsi DKI Jakarta paket F05 dan Provinsi Bali paket C09 dengan format 1
0 (sudah di koreksi benar salahnya). Jumlah soal terdiri dari 40 butir diantaranya 5
butir jangkar (butir yang sama) dan 35 butir berbeda dari kedua perangkat. Data
diambil dari Pusat Penilaian Pendidikan, Jakarta Pusat.Jumlah peserta tes yang
diambil adalah 887 peserta di Provinsi Bali dan 1118 di Provinsi DKI Jakarta.
Prosedur Analisis data
Tahapan-tahapan yang dilakukan pada penelitian ini adalah sebagai berikut:
1. Persiapan data dan melakukan eksplorasi data.
2. Menduga parameter tingkat kesukaran (b), daya pembeda (a), dan peluang
menebak (c) untuk kedua perangkat tes.
3. Menduga parameter kemampuan peserta tes untuk kedua kelompok peserta.
4. Menghitung konstanta persamaan penyetaraan dengan metode rerata sigma.
5. Membuat persamaan penyetaraan skor kedua perangkat tes.
6. Mengkonversi skor Bali terhadap DKI.
7. Interpretasi.
HASIL DAN PEMBAHASAN
Deskripsi Skor UN MTK IPA SMA dari Kedua Perangkat
Skor UN MTK IPA SMA dari kedua provinsi memiliki rata-rata nilai yang
hampir sama. Namun, Bali memiliki rata-rata nilai yang lebih tinggi dari pada
DKI Jakarta.
Gambar 1 Histogram Skor UN MTK IPA SMA Provinsi Bali
7
Gambar 2 Histogram Skor UN MTK IPA SMA Provinsi DKI Jakarta
Sebaran skor dari kedua perangkat terlihat berbeda pada gambar histogram.
Histogram skor UN MTK IPA SMA di Provinsi DKI Jakarta lebih berbentuk
menyerupai genta (lonceng) yang menandakan kenormalan data sedangkan
histogram skor di Provisi Bali lebih curam di sebelah kanan. Hal ini menunjukkan
bahwa banyaknya peserta UN MTK SMA di Bali yang mendapat skor tinggi.
Terdapat 26.606% peserta UN MTK SMA di Provinsi Bali memperoleh skor
sebesar sama dengan lebih dari 90. Sedangkan terdapat 12.245% peserta di
Provinsi DKI Jakarta yang memeperoleh skor sama dengan lebih dari 90.
Gambar 3 Boxplot Skor Butir jangkar UN MTK SMA Provinsi Bali dan DKI
Jakarta
8
Gambar 4 Boxplot skor Tanpa butir Jangkar UN MTK SMA Povinsi Bali dan
DKI Jakarta
Rata-rata skor butir jangkar UN MTK SMA di Provinsi Bali lebih kecil
daripada di Provinsi DKI Jakarta yakni sebesar 66.448 dan 80.501. Jika dilihat
dari tiga puluh lima soal lain tanpa butir jangkar, Bali memiliki rata-rata skor yang
lebih tinggi daripada DKI Jakarta yaitu 72.613 dan 64.546. Hal demikian
menimbulkan dugaan bahwa perangkat Bali lebih mudah daripada DKI Jakarta
atau kemampuan peserta di Provinsi DKI Jakarta lebih tinggi daripada peserta di
Provinsi Bali.
Asumsi Teori Respon Butir
Asumsi Unidimensi
Teori respon butir dapat dilakukan ketika asumsi yang ada telah terpenuhi.
Asumsi unidimendional terpenuhi ketika dua akar ciri pertama dari respon peserta
memiliki rasio yang besar. Karena keterbatasan data yang didapat, maka peneliti
tidak dapat melakukan pemeriksaan asumsi ini. Akan tetapi, asumsi unidimensi
sudah di periksa ketika uji coba pembuatan perangkat soal. Maka dari itu, dapat
disimpulkan bahwa kedua perangkat tes sudah memenuhi asumsi unidimensi.
Asumsi Kebebasan Lokal
Ketika asumsi unidimensi sudah terpenuhi, maka asumsi kebebasan lokal
diperoleh. (Lord 1980) Maka dari itu, dapat disimpulkan bahwa respon dari
perangkat tes DKI Jakarta dan Bali sudah memenuhi asumsi kebebasan lokal baik
butir maupun peserta tes.
Pendugaan Parameter pada Teori Respon Butir
Model teori respon butir yang digunakan dalam penelitian ini adalah tiga
parameter logistik. Parameter butir yang diduga dari kedua perangkat tes ini
adalah daya pembeda butir, tingkat kesukaran butir, peluang menebak, dan
kemampuan peserta tes. Pada proses perhitungan dengan software, terdapat dua
butir dari kedua perangkat tes tidak keluar hasil nya. Hal tersebut dikarenakan
9
status respon yang benar semua. Pada Provinsi Bali butir nomer 24 dan 34 serta
pada Provinsi DKI Jakarta butir nomer 20 dan 29.
Daya Pembeda
Daya pembeda butir selalu bernilai positif. Semakin tinggi nilai daya
pembeda maka semakin baik pula butir soal. Daya pembeda butir
mengindikasikan dapat atau tidaknya suatu butir membedakan peserta yang
memiliki kemampuan pendidikan yang tinggi dan yang kurang. Daya pembeda
paling tinggi pada perangkat Bali terdapat pada butir nomer 10 dan pada
perangkat DKI Jakarta pada butir nomer 34. Nilai tengah daya pembeda pada
perangkat Bali lebih tinggi daripada DKI Jakarta yakni sebesar 3.58 dan 2.43.
Daya pembeda yang berkisar lebih dari 1.70 merupakan daya pembeda yang
sangat tinggi yang mengndikasikan bahwa butir soal sudah sangat baik
membedakan kategori peserta yang berkemampuan tinggi dan rendah. (Baker
1985)
12
10
8
DKI
6
BALI
4
2
0
1
3
5
7
9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39
Gambar 5 Grafik Daya Pembeda Bali dan DKI Jakarta
Tingkat Kesukaran
Tingkat kesukaran butir merupakan nilai kemampuan peserta ketika peluang
peserta menjawab benar adalah sebesar 0.5. Hal ini berarti nilai tingkat kesukaran
yang tertinggi merupakan kemampuan tertinggi yang dikerahkan untuk
mempunyai peluang menjawab butir soal dengan benar sebesar 50%. (Humbelton
et al 1991)
Tabel 1 Uji Beda Satu Arah Tingkat Kesukaran Kedua Perangkat Tes
Bali
DKI
Jakarta
N
Mean
StDev
38
-0.699
1.377
38
-0.169
1.034
Thitung
Ttabel
-0.076
1.66-1.67
10
Hipotesis nol dari uji beda satu arah ini adalah nilai tengah indeks tingkat
kesukaran di Provinsi Bali tidak lebih kecil daripada DKI Jakarta. Statistik uji t
yang dihitung lebih kecil daripada statistika uji t pada tabel. Maka dari itu,
kesimpulan yang didapat dari uji beda satu arah ini pada taraf nyata 5% adalah
nilai tengah indeks tingkat kesukaran Bali tidak lebih kecil daripada DKI Jakarta
berarti bahwa perangkat tes pada Provinsi Bali tidak lebih sulit daripada DKI
Jakarta.
Peluang Menebak Peserta untuk Menjawab Benar
Peluang menebak peserta ini dikenal sebagai Pseudo-chance-level parameter.
Peluang menebak peserta UN MTK SMA Bali dan DKI Jakarta untuk menjawab
benar hampir mendekati nilai yang sama yakni 0.221 dan 0.243. Peluang menebak
peserta untuk menjawab benar berkaitan dengan performa butir dan pilihan
jawaban.
Kemampuan Peserta Tes
Pada perangkat tes Provinsi Bali, kemampuan peserta berkisar antara -2,92
sampai 1,59 sedangkan di Provinsi DKI Jakarta, kemampuan peserta berada pada
kisaran -2,54 sampai 2,18.
Tabel 2 Uji Beda Kemampuan Peserta dari Kedua Provinsi
Provinsi
Mean
StDev
DKI Jakarta
0.004
0.982
Bali
-0.025
1.009
p value
0.507
Hipotesis nol dari uji beda dua arah ini adalah nilai tengah parameter
kemampuan peserta tes di Provinsi Bali tidak berbeda dengan nilai tengah
parameter kemampuan peserta tes di Provinsi DKI Jakarta. Setelah dilakukan
pengujian dengan menggunakan sebesar 5% didapat p-value sebesar 0.507 dan
dapat disimpulkan bahwa nilai tengah parameter kemampuan peserta tes di
Provinsi Bali tidak berbeda dengan nilai tengah parameter kemampuan peserta tes
di Provinsi DKI Jakarta.
Penyetaraan Kedua Perangkat
Perhitungan konstanta α dan β dilakukan menggunakan software yang
kemudian diperoleh hasil 0.36 dan -0.49.
11
Gambar 6 Grafik Penyetaraan Tes Bali Terhadap DKI Jakarta
Tes DKI Jakarta yang dianggap sebagai tes 1 dijelaskan oleh garis hitam, tes
Bali dijelaskan oleh garis hitam putus-putus. Garis berwarna merah merupakan
hasil penyetaraan skor Bali terhadap DKI Jakarta. Garis berwarna biru merupakan
butir jangkar dari kedua tes. Butir jangkar DKI jakarta dijelaskan oleh garis biru
biasa sedangkan butir jangkar Bali dijelaskna oleh garis biru putus-putus.
Ketika kemampuan peserta DKI Jakarta sebesar nol mendapatkan skor
sekitar 22.8, lebih rendah daripada skor yang didapat peserta Bali dengan
kemampuan yang sama. Pada hasil penyetaraan yang ditunjukkan oleh garis
merah, dengan kemampuan peserta yang sama-sama sebesar nol skor yang
didapatkan DKI Jakarta sebesar sekitar 22.8 akan setara dengan skor sekitar 34.2
di Bali. Keadaan berbeda ditunjukkan ketika kemampuan peserta berada pada
selang -5 sampai -3. Skor yng dihasilkan menunjukkan angka yang hampir sama.
Pergerakan naik dan turun skor yang didapat dari kedua tes terlihat tidak stabil
pada kemampuan peserta pada selang -3 sampai 0. Pada interval kemampuan 2
sampai 5 skor yang didapat sudah stabil posisinya.
Gambar 7 Daya Pembeda Kedua Perangkat setelah disetarakan
12
Gambar 8 Tingkat Kesukaran Kedua Perangkat Setelah Disetarakan
Gambar 9 Peluang Menebak Kedua Perangkat Setelah Disetarakan
Ketiga gambar tersebut merupakan hasil parameter butir jangkar yang telah
dilakukan penyetaraan. Butir jangkar yang ada sebenarnya adalah 5 butir. Namun
untuk butir nomor 29 pada perangkat DKI Jakarta tidak keluar parameter butir nya,
maka butir jangkar yang dimasukkan hanya 4 butir yakni nomor 10, 12, 17, dan
23.
13
Pada daya pembeda baru hasil penyetaraan hanya terlihat tiga butir. Hal
tersebut dikarenakan satu butir lainnya memiliki indeks daya pembeda yang lebih
dari 3 dan plot yang ditampilkan hanya berkisar hingga 3.
SIMPULAN DAN SARAN
Simpulan
Pendugaan ketiga parameter yakni daya pembeda, tingkat kesukaran, dan
peluang menebak dilakukan terhadap kedua perangkat tes. Rata-rata indeks
parameter daya pembeda soal pada perangkat DKI Jakarta lebih rendah daripada
Bali. Perangkat tes Bali lebih mudah daripada perangkat tes DKI Jakarta. Ratarata peluang menebak benar soal DKI Jakarta dan Bali hampir sama yakni sebesar
0.243 dan 0.221. Nilai tengah parameter kemampuan peserta tes DKI Jakarta tidak
berbeda dengan Bali yang berarti bahwa kemampuan peserta DKI Jakarta dan Bali
tidak berbeda. Ketika kemampuan peserta yang sama-sama sebesar nol skor yang
didapatkan DKI Jakarta sebesar 22.8 akan setara dengan skor 34.2 di Bali.
Saran
Penelitian ini masih terdapat banyak kekurangan, maka dari itu untuk
penelitian selanjutnya disarankan agar mencoba semua model teori respon butir
untuk keseluruhan perangkat.Selain itu, perangkat yang disetarakan diambil dari
beberapa provinsi yang latar belakang pendidikannya sangat timpang.Diusahakan
agar mendapatkan data hasil jawaban peserta secara lengkap bukan hanya status
respon hasil pemeriksaan agar lebih memudahkan untuk analisis apapun.
DAFTAR PUSTAKA
Crocker L, Algina J. 1986. Introduction to classical and modern test theory. New
York(US): Holt, Rinehart and Winston, Inc.
Davier, A. 2009. Statistical Models for Test Equating, Scaling, and Linking.
Newyork(US): Springer.
Hambleton RK, Swaminathan H, Jane RH.1991. Fundamentals of Item Response
Theory. London(GB): SagePublications.
Hogg RV, Mckean JW, AT Craig. 1978. Introduction to Mathematical Statistics
4th Edition. New York(US): Macmillan Publishing.
Lord, FM. 1980. Application of Item Response Theory to Practocal Testing
Problems. Erlbaum Associate.
Naga, DS. 1992. Pengantar Teori Skor Pada Pengukuran Pendidikan.
Jakarta(ID): Besbats
Peterson NS, Kolen M J. 1989. Scalling, Norming, and Equating. In R. L. Linn
(Ed), Educational Measurement. New York(US): Macmillan
14
Thorpe GL, Favia A. 2012. Data Analysis Using Item Response Theory
Methodology: an Introduction to Selected Program and Aplication
[Psychology Faculty Scholarship Paper 20]. Main(US): University of Maine.
Wijaya, YS. 2013. Comparison of Item Difficulty Index National Exam Package
(Analysis Using Item response Theory).Jakarta(ID): Universitas Negeri
Jakarta
15
Lampiran 1 Daya Pembeda (a), Tingkat Kesukaran (b), dan Peluan Menebak (c)
Provinsi DKI Jakarta dan Bali
NOMOR
BUTIR
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
DKI JAKARTA
a
b
c
1.827
-1.488
0.149
1.581
1.069
0.278
0.829
-0.396
0.136
1.345
-1.341
0.179
2.514
0.587
0.403
1.028
0.278
0.186
2.054
-1.486
0.113
0.644
-2.324
0.158
1.412
-1.252
0.168
0.805
-0.111
0.187
1.441
-1.510
0.146
2.306
-0.551
0.248
1.351
-1.101
0.228
1.879
-1.295
0.235
1.614
-1.401
0.199
3.230
0.202
0.330
2.074
-1.262
0.145
5.788
0.537
0.328
2.946
1.709
0.195
1.626
0.832
1.327
4.996
0.963
5.699
4.942
2.491
-1.494
0.489
-0.991
0.686
0.798
0.144
0.693
0.867
0.127
0.133
0.250
0.243
0.274
0.410
0.356
0.287
3.848
1.348
4.801
0.585
5.932
4.127
0.729
-1.335
0.808
-1.055
0.746
0.524
0.314
0.169
0.267
0.181
0.394
0.253
a
1.345
6.881
2.111
1.860
4.202
1.644
2.362
5.143
0.502
9.807
2.133
1.794
6.195
2.037
1.734
2.293
1.705
8.269
5.100
1.571
0.964
7.059
0.976
BALI
b
-2.269
0.443
-1.783
-1.213
0.148
-1.363
-1.281
0.502
-0.070
0.504
-1.851
-1.953
0.618
-1.883
-2.438
-1.136
-1.847
0.646
0.182
-1.912
-2.302
0.151
0.589
c
0.199
0.097
0.144
0.173
0.354
0.120
0.214
0.397
0.244
0.165
0.183
0.182
0.331
0.192
0.179
0.080
0.189
0.201
0.251
0.161
0.161
0.321
0.199
5.818
1.304
4.809
4.275
5.494
8.413
1.852
5.318
1.857
0.063
-5.750
0.291
0.143
0.202
0.150
-1.852
0.292
-1.261
0.219
0.200
0.295
0.184
0.146
0.313
0.200
0.259
0.134
3.821
0.771
0.243
16
DKI JAKARTA
BALI
NOMER
BUTIR
a
b
c
a
b
36
3.446
0.566
0.304
5.124
0.438
37
2.396 -0.110
0.365
0.947 -1.850
38
4.364
0.795
0.237
4.257
0.621
39
1.206
0.678
0.377
2.435
0.409
40
0.796
1.154
0.285
2.703
0.265
Keterangan:
Butir jangkar (butir yang sama) dari kedua perangkat
c
0.272
0.162
0.252
0.409
0.394
Butir yang output nya tidak keluar karena status respon yang benar
semua
17
RIWAYAT HIDUP
Penulis dilahirkan di Bogor pada 5 Februari 1993 dan merupakan anak
ketiga dari tiga bersaudara pasangan (alm.)Saefudin dan Siti Masitoh.
Penulis menyelesaikan pendidikan dasar di SD Pertiwi pada tahun 2004,
pendidikan menengah pertama di SMP Negeri 1 Bogor pada tahun 2007,
pendidikan menengah atas di SMA Negeri 4 Bogor pada tahun 2010. Penulis
diterima di Institut pertanian Bogor pada tahun 2010 melalui jalur Undangan
Seleksi Masuk IPB (USMI) dan tercatat sebagai mahasiswa Departemen
Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam dengan minor Ilmu
konsumen.
Selama perkuliahan, penulis mengikuti beberapa kegiatan non akademik
seperti organisasi MAX!! dan Gamma Sigma Beta dan menjabat beberapa posisi.
Penulis juga mengikuti beberapa kepanitiaan dan yang terahir adalah kepanitiaan
the 8th Statistika Ria.
Penulis mengikuti praktik lapang di Dinas Kependudukan dan Pencatatan
Sipil Provinsi DKI Jakarta pada bulan Juli-Agustus 2013 selama dua bulan.