PENYETARAAN SEKOR ANTARA DUA PERANGKAT TES BAHASA INGGRIS DENGAN DESAIN BUTIR ANCHOR BERSAMA.

(1)

PENYETARAAN SEKOR ANTARA DUA PERANGKAT TES BAHASA INGGRIS DENGAN DESAIN BUTIR ANCHOR BERSAMA

TESIS

Diajukan untuk Memenuhi Sebagian dari Syarat untuk Memperoleh Gelar Magister Pendidikan Program Studi Penelitian dan Pengukuran Pendidikan

Oleh

DESI SUSANTI 1202654

SEKOLAH PASCASARJANA

UNIVERSITAS PENDIDIKAN INDONESIA

2014


(2)

PENYETARAAN SEKOR ANTARA DUA PERANGKAT TES BAHASA INGGRIS DENGAN DESAIN BUTIR ANCHOR BERSAMA

Oleh: Desi Susanti

Sarjana Pendidikan Universitas PGRI Palembang, 2005

Sebuah Tesis yang diajukan untuk memenuhi salah satu syarat memperoleh gelar Magister Pendidikan (M.Pd.) pada Program Studi Penelitian dan Pengukuran

Pendidikan

© Desi Susanti 2014 Universitas Pendidikan Indonesia

Juli 2014

Hak Cipta dilindungi undang – undang

Tesis ini tidak boleh diperbanyak seluruhnya atau sebagian


(3)

LEMBAR PENGESAHAN

Disetujui dan disahkan oleh pembimbing:

Pembimbing,

Prof. DR. H. Asmawi Zainul, M.Ed.

Mengetahui,

Ketua Program Studi Penelitian dan Pengukuran Pendidikan

DR. Budi Susetyo, M.Pd NIP. 195809071987031001


(4)

PENYETARAAN SEKOR ANTARA DUA PERANGKAT TES BAHASA INGGRIS DENGAN DESAIN BUTIR ANCHOR BERSAMA

DESI SUSANTI 1202654

ABSTRAK

Penelitian ini bertujuan untuk (1) menganalisis karakteristik dari dua perangkat tes bahasa inggris (2) menemukan rumusan persamaan konversi yang digunakan untuk menyetarakan sekor-sekor dari dua perangkat tes yang berbeda hingga menghasilkan sekor yang setara. Metode yang di gunakan dalam penelitian ini adalah deskriptif exploratif, variabel bebas adalah metode penyetaraan linier dan variabel terikat sekor hasil penyetaraan. Instrumen yang digunakan adalah dua perangkat tes dengan pilihan ganda sebanyak 35 butir soal pada mata pelajaran Bahasa Inggris untuk siswa SMA kelas XI, di mana dua perangkat tes mengandung butir anchor yang menyebar di antara kedua perangkat tes tersebut. Data penelitian berupa skor siswa kelas XI SMA di kabupaten Bangka Tengah, yang diambil menggunakan teknik penarikan sampel yaitu cluster random

sampling sebanyak 200 orang siswa untuk setiap instrumen penelitian. Desain

yang digunakan dalam penyetaraan ini adalah desain common item nonequivalent

groups. Dari hasil analisis data di dapat rumusan persamaan konversi sekor yaitu

Y*=0,94(X-51,82)+49,08 dan X*=1,15(Y-49,1)+51. Berdasarkan hasil penyetaraan sekor dengan rumusan persamaan konversi ini di dapatkan sekor-sekor tes siswa yang setara.


(5)

THE EQUITING OF SCORES

BETWEEN TWO OF INSTRUMENT ENGLISH TEST BY ANCHOR INTERNAL ITEM DESIGN

DESI SUSANTI 1202654

ABSTRACTS

This research was aimed to analyze the characteristics of two instrument English test (2) to find the conversion formula of equiting were used to equite the scores came from two of different instrument test until produced an equivalent scores. The method of study was descriptive exploratory. The independent variable was a

linear equiting method and the dependent variable was score’s result from

equiting. The instruments of the study were two of instruments with multiple-choice tests as many as 35 items on the subjects of English for the high school students of class XI, in which two of device test contains of anchor items were spread between both the device test. The data of research data was score of the high school students in Central Bangka regency, which was taken using sampling techniques, namely cluster random sampling as many as 200 students for each instrument. The design was used in this equiting was a common item nonequivalent groups design. From the analysis of data obtained the score conversion formula equation is Y * = 0.94 (X-51, 82) +49.08 and X * = 1.15 (Y-49, 1) +51. Based on the results of the equiting using the conversion formula was found that the equivalent of score test.


(6)

DAFTAR ISI

Halaman

HALAMAN JUDUL ... i

LEMBAR PENGESAHAN ... ii

PERNYATAAN ... iii

ABSTRAK ... iv

KATA PENGANTAR ... vi

UCAPAN TERIMA KASIH ... vii

DAFTAR ISI ... ix

DAFTAR TABEL ... xi

DAFTAR GAMBAR ... xii

DAFTAR LAMPIRAN ... xiii

BAB I PENDAHULUAN A. Latar Belakang ... 1

B. Identifikasi Masalah ... 7

C. Pembatasan Masalah ... 8

D. Rumusan Masalah ... 8

E. Tujuan Penelitian ... 9

F. Manfaat Penelitian ... 9

BAB II PENYUSUNAN KERANGKA TEORITIK, KERANGKA BERPIKIR DAN PENGAJUAN HIPOTESIS A. Kajian Teoritis ... 10

1. Pengukuran ... 10

2. Tes ... 11

3. Reliabilitas ... 14

4. Tingkat Kesukaran ... 16

5. Daya Pembeda ... 18

6. Sekor Tes ... 20

7. Penyetaraan Sekor ... 21

8. Rancangan Penyetaraan Sekor ... 22

a. Rancangan A ... 24

b. Rancangan B ... 24

c. Rancangan C ... 25


(7)

9. Metode Penyetaraan Sekor ... 27

a. Penyetaraan Linier Rancangan A ... 28

b. Penyetaraan Linier Rancangan B ... 29

c. Penyetaraan Linier Rancangan C dan D ... 29

10.Butir Anchor ... 30

B. Penelitian Yang Relevan ... 32

BAB III METODE PENELITIAN A. Populasi dan Sampel ... 33

B. Metode Penelitian ... 33

C. Variabel Penelitian ... 34

D. Definisi Operasional ... 34

E. Instrumen Penelitian ... 35

F. Rancangan Prosedur Penelitian ... 36

G. Teknik Pengumpulan Data ... 38

H. Teknik Analisis Data ... 38

1. Menghitung Reliabilitas ... 38

2. Tingkat Kesukaran ... 38

3. Daya Pembeda ... 39

4. Penyetaraan Sekor ... 40

BAB IV HASIL PENELITIAN DAN PEMBAHASAN A. Deskripsi Data ... 41

1. Deskripsi Data Responden ... 41

a. Sekor Hasil Tes Siswa pada Instrumen X ... 41

b. Sekor Hasil Tes Siswa pada Instrumen Y ... 42

2. Deskripsi Karakteristik Instrumen Tes ... 44

a. Reliabilitas ... 44

b. Taraf kesukaran Butir Soal... 44

c. Daya Beda ... 48

B. Deskripsi Data Hasil Penyataraan ... 52

C. Pembahasan Hasil Penelitian ... 53

1. Pembahasan Karakteristik perangkat tes ... 53

2. Pembahasan Penyetaraan Sekor ... 54

BAB V KESIMPULAN DAN SARAN A. Kesimpulan ... 56

B. Saran dan Rekomendasi ... 57


(8)

BAB 1 PENDAHULUAN

A. LATAR BELAKANG MASALAH

Pengukuran merupakan suatu proses pemberian angka kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang, hal atau objek tertentu menurut aturan atau formulasi yang jelas. Berdasarkan pandangan tersebut, tampak bahwa semua kegiatan didunia ini tidak bisa lepas dari pengukuran. Keberhasilan suatu program dapat diketahui melalui suatu pengukuran, begitu juga perkembangan ilmu pengetahuan dan teknologi. Penelitian-penelitian yang dilakukan dalam semua bidang selalu melibatkan kegiatan pengukuran, baik yang bersifat kualitatif maupun kuantitatif. Oleh karena itu, pengukuran memegang peranan penting, baik untuk pengembangan ilmu pengetahuan dan teknologi maupun untuk penyajian informasi bagi pembuat kebijakan (Mardapi, 2008:2).

Pada dasarnya pengukuran merupakan kegiatan penentuan angka bagi suatu objek secara sistematik. Penentuan angka ini merupakan usaha untuk menggambarkan karakteristik suatu objek. Kemampuan seseorang dalam bidang tertentu dinyatakan dengan angka. Kesalahan yang terjadi pada pengukuran ilmu-ilmu sosial biasanya disebabkan oleh alat ukur, cara mengukur dan keadaan objek yang diukur. Masalah evaluasi hasil belajar meliputi alat ukur yang digunakan, cara menggunakan, cara penilaian dan evaluasinya.

Pengukuran yang tepat dapat memberikan informasi yang akurat mengenai penguasaan seseorang atau sekelompok orang terhadap materi yang dipelajari, dan informasi itu berguna untuk mengambil sebuah keputusan. Kesahihan alat ukur dapat dilihat dari konstruk alat ukur, yaitu mengukur seperti yang direncanakan. Alat ukur yang baik memberi hasil yang konstan bila digunakan berulang-ulang, asalkan kemampuan yang diukur tidak berubah. Pengukuran hasil belajar di sekolah dilakukan dengan menggunakan alat ukur yaitu berupa instrumen yang mana alat ini untuk mengukur hasil belajar kognitif yang dinamakan tes.


(9)

2

Tes sebagai alat bantu mengukur berisikan serangkaian pertanyaan atau tugas yang harus dijawab, dikerjakan atau dilaksanakan oleh responden yang dites (Susetyo,2011:2). Kemampuan kognitif seseorang atau sekelompok diketahui melalui tes prestasi belajar. Tes prestasi belajar memuat butir-butir soal yang disusun untuk mengukur kemampuan siswa terhadap materi pelajaran yang diberikan. Hasil tes merupakan informasi tentang karakteristik seseorang atau sekelompok orang. Tes merupakan salah satu cara untuk menaksir besarnya tingkat kemampuan siswa secara langsung, yaitu melalui respon siswa terhadap sejumlah stimulus atau pertanyaan. Oleh karena itu agar diperoleh informasi yang akurat dibutuhkan tes yang handal (Rasyid dan Mansur, 2007:9).

Supaya hasil dari pengukuran tersebut menggambarkan yang sesungguhnya, maka dalam pengelolaannya dan termasuk penyelenggaraanya harus dilakukan secara profesional, akurat, objektif dan adil. Rendahnya mutu pendidikan berhubungan dengan rendahnya hasil belajar, dan berhubungan pula dengan kemampuan guru dalam melaksanakan proses pembelajaran serta membuat evaluasi belajar. Guru merasa kurang terampil dalam menyusun tes hasil belajar yang benar dan bermakna (Supriyati, 2003:4).

Kenyataan yang dihadapi sekarang tes yang dipergunakan di sekolah saat ini pada umumnya dibuat oleh guru. Masih banyak guru tidak mengetahui prosedur pembuatan tes yang baik. Kebanyakan tes disusun dalam jangka waktu yang sangat singkat bahkan ada juga yang mengadopsi langsung butir-butir tes yang telah tersedia dibuku panduan belajar, dan perangkat tersebut langsung diberikan sebagai perangkat tes untuk melakukan evaluasi baik sumatif maupun formatif, tidak menutup kemungkinan alat tes yang digunakan oleh guru sebagai evaluasi tidak dapat mengukur apa yang sebenarnya akan diukur.

Kesalahan pengukuran ini mengakibatkan kekeliruan dalam pengambilan keputusan, maka dalam melaksanakan evalusi pembelajaran guru memerlukan alat ukur yang dapat mengukur dengan tepat keberhasilan siswa dalam pembelajaran. Hasil tes yang diperolah dengan cara tidak adil, tidak dapat memberikan informasi untuk mengetahui prestasi siswa yang sebenarnya, dan hasil tes seperti itu dapat memberikan informasi yang keliru mengenai keberhasilan (Azwar, 1996:14).


(10)

3

Oleh karena itu guru harus mempersiapkan perangkat tes yang sahih dan terandal untuk mengukur keberhasilan belajar siswa. Seorang tenaga pengajar haruslah mengetahui dasar-dasar penyusunan tes prestasi belajar yang baik agar dapat memperoleh hasil ukur yang akurat (valid) dan dapat dipercaya (reliabel). Mereka harus pula mengetahui aspek-aspek penggunaannya yang layak di kelas, mengetahui cara-cara pemberian angka, dan yang paling penting adalah mengetahui pula cara interpretasi hasil pengukuran tersebut (Azwar, 1987:9).

Dalam penyelenggaraan evaluasi hasil belajar, guru terkadang mendapat kesulitan untuk menyelenggarakan tes, diantaranya tes formatif dan sumatif. Permasalahannya adalah guru memiliki kelas pararel yang cukup banyak. Contohnya Tes formatif biasanya diselenggarakan sesuai dengan jam pelajaran masing-masing. Jika hanya menggunakan satu instrumen saja tidak menutup kemungkinan saling mencontek dan kebocoran soal antar sesama murid tidak dapat dihindari. Maka untuk menghindari situasi demikian para guru membuat lebih dari satu perangkat tes yang tujuannya untuk mengatasi permasalahan tersebut. Perangkat-perangkat tes yang lebih dari satu tersebut dibuat dari kisi-kisi yang sama dan untuk mengukur tingkat kemampuan yang sama, namun tidak menutup kemungkinan memiliki karakteristik soal yang berbeda yaitu dari segi validitas, reliabilitas soal, tingkat kesukaran maupun daya pembedanya.

Menurut Hambleton yang dikutif oleh Rustam (2000) Sebenarnya tidak pernah dua perangkat atau lebih mempunyai item yang sama tingkat kesukarannya. Maka dalam hal ini ada siswa yang dirugikan karena mengerjakan soal yang sulit, ada juga siswa yang beruntung karena mendapatkan soal yang mudah. Malahan hasil sekor-sekor dari evaluasi tersebut diperbandingkan untuk menentukan prestasi siswa atau penentuan kenaikan kelas, hal ini merupakan hal yang tidak adil maka pemberian nilai terhadap hasil belajar siswa tidak mencerminkan prestasi yang sebenarnya.

Jika permasalahan ini dibiarkan berlarut-larut tanpa ditanggulangi maka sistem evaluasi yang digunakan oleh para pendidik sebagai pembuat keputusan atas prestasi siswa memiliki kecacatan. Jadi perlu ada terobosan yang bisa menanggulangi permasalahan yang telah dialami oleh para pendidik selama ini.


(11)

4

Sudah saatnya para penerima didikan mendapatkan perlakuan yang adil yang bisa mencerminkan dan menentukkan prestasi yang telah menjadi hak mereka. Untuk mendapatkan informasi yang adil bagi setiap siswa selain diperlukan alat ukur yang baik juga proses perhitungan sekor tes yang baik. Pendapat Setiadi yang dikutip oleh Supriyati (2003:7) bahwa alat ukur yang baik meliputi perangkat tes yang dapat mengestimasi kemampuan seseorang dengan kesalahan pengukuran yang sekecil-kecilnya.

Proses perhitungan sekor tes yang baik adalah suatu proses yang mana seluruh siswa bisa mendapatkan perlakuan yang adil dari hasil evaluasi tersebut. Lagi pula proses ini dapat mengukur prestasi yang sebenarnya sesuai dengan kemampuan siswa dan dapat membedakan yang mana siswa yang pandai atau yang tidak. Untuk mengatasi permasalahan didalam pemberian sekor tes yang adil maka dapat dilakukan cara melakukan penyetaraan sekor, yaitu menyetarakan sekor-sekor tes yang didapat dari kedua perangkat atau lebih yang berbeda

Penyetaraan sekor merupakan proses secara statistik untuk menentukan hubungan antar skala sekor dari dua atau lebih tes agar sekor-sekor tersebut diperlakukan secara adil (Weiss, 1983:147). Dengan melalui proses penyetaraan sekor maka peserta tes tidak merasa dirugikan atau diuntungkan karena mendapatkan perangkat tes yang sulit atau mudah. Penyetaraan sekor ini memberlakukan pensekoran yang dapat mengestimasi kesalahan pengukuran sekecil-kecilnya. Menggunakan penyetaraan sekor dapat memberikan informasi hasil tes yang objektif, artinya siswa yang pandai hendaknya mendapatkan sekor lebih tinggi daripada siswa yang berkemampuan sedang dan rendah (Supriyati, 2003:13).

Dalam pengukuran tes klasik penyetaraan sekor terdapat dua arah yaitu penyetaraan horizontal dan vertikal. Penyetaraan horizontal dilakukan untuk mengukur responden yang setara dan juga atribut yang setara, sementara penyetaraan vertikal dilakukan untuk mengukur responden yang tidak setara (Dali, 2012:350). Sesuai permasalahan yang telah diuraikan diatas maka penelitian ini terfokus pada penyetaraan horizontal.


(12)

5

Didalam penyetaraan sekor tes horizontal terdapat beberapa rancangan yang dapat dipakai dalam menyamakan sekor yaitu penyetaraan pada kelompok tunggal, kelompok bersama dan kelompok butir anchor. Rancangan yang cukup cermat dalam mengatasi kelas pararel yang banyak yaitu dengan rancangan kelompok butir anchor. Pada rancangan ini perangkat tes yang lebih dari satu dikemas secara pararel dengan butir anchor. Butir anchor yang dimaksud adalah dimana terdapat butir yang sama dibeberapa perangkat tes tersebut dan berbaur dengan butir yang non anchor. Belum bisa dipastikan dengan jelas berapa jumlah anchor yang dapat digunakan pada perangkat-perangkat tes tersebut. Namun sekor-sekor yang berasal dari perangkat tes yang berbeda harus berasal dari perangkat tes yang memiliki reabilitas yang sama merata, dan juga taraf kesukaran yang merata (Dali, 1992:347). Jadi sebelum dilakukan penyetaraan sekor pada penelitian ini perlu peninjauan terhadap karakteristik kedua instrumen tersebut yang meliputi reliabilitas, tingkat kesukaran dan daya beda.

Dalam penyetaraan sekor secara klasik terdapat dua metode penyetaraan diantaranya adalah metode penyetaraan linier dan metode penyetaraan ekipersentil. Metode penyetaraan secara linier hubungan sekor setara dan sekor asal linier. Pada penyetaraan secara ekipersentil, peringkat secara persentil pada sekor setara disamakan dengan peringkat persentil pada sekor asal sehingga hubungan mereka menjadi pada umumnya nonlinier (Dali, 2012:356). Penelitian ini terfokus hanya pada metode penyetaraan linier. Menurut Weiss (1983,148) asumsi penyetaraan dengan cara linier adalah sekor tes distribusinya berbeda, distribusi tersebut terkait dengan rerata dan simpangan bakunya.

Kebutuhan akan betapa pentingnya penyetaraan sekor memang telah lama disadari dan sangat bermanfaat untuk dikembangkan dalam pengukuran pendidikan. Namun karena pemikiran dan penelitian terhadap penyetaraan sekor ini yang masih sangat terbatas. Adapun beberapa penelitian-penelitian yang telah ada sekarang ini kebanyakan penyetaraan sekor hanya dilakukan dalam ruang lingkup pengukuran dalam pembelajaran sain saja, jarang sekali atau bahkan belum ditemukan penelitian penyetaraan sekor dalam pengukuran pembelajaran Bahasa Inggris.


(13)

6

Seharusnya penyetaraan sekor ini harus bisa diterapkan dalam pengukuran pendidikan semua bidang ilmu. Diantara beberapa penelitian tersebut melakukan penyetaraan sekor terhadap perangkat-perangkat tes untuk menemukan persamaan konversinya.

Diantaranya seperti Rustam (2000) meneliti penyetaraan terhadap perangkat tes Matematika, dari hasil penelitiannya ditemukan suatu formula penyetaraan terhadap dua perangkat tes program D2 UT untuk wilayah kota Bogor dan Bandar Lampung. Selanjutnya Syahril (1998) yang mana dari hasil penelitiannya menunjukkan dari beberapa perangkat tes Kimia SMU untuk kotamadya Banjarmasin sebelum dilakukan penyetaraan memiliki tingkat kesukaran yang berbeda maka harus beberapa perangkat tersebut harus dilakukan kesetaraan sekor untuk menentukan prestasi siswa.

Berpijak dari beberapa penelitian-penelitian yang telah ada ini lah maka peneliti tertarik untuk melakukan pengukuran terhadap kedua perangkat tes Bahasa Inggris yang berbeda dalam bentuk penyetaraan sekor. Mengingat penelitian-penelitian mengenai penyetaraan sekor sebelumnya diteliti banyak dalam pengukuran pelajaran sain dan sangat jarang ditemukan dalam pengukuran pada bidang ilmu bahasa. Maka sesuai dengan latar belakang peneliti seorang guru Bahasa Inggris maka dalam penelitian ini pelajaran Bahasa Inggris yang digunakan untuk tingkat SLTA.


(14)

7

B. IDENTIFIKASI MASALAH

Berdasarkan paparan yang telah dikemukakan didalam latar belakang masalah diatas dapat diidentifikasikan diantaranya adalah:

1. Bahwa tes yang digunakan di sekolah-sekolah pada umumnya dibuat oleh guru. Namun, masih banyak para guru kurang mengetahui prosedur pembuatan tes yang baik.

2. Bahwa kebanyakan alat evaluasi yang digunakan oleh guru disusun dalam waktu yang sangat singkat bahkan mengadopsi dari buku panduan belajar tanpa dianalisis terlebih dahulu, dan langsung diberikan kepada siswa sebagai tes sumatif dan formatif untuk menentukkan keberhasilan peserta didiknya. 3. Bahwa guru sering mendapatkan kesulitan dalam menyelenggarakan tes

formatif atau tes sumatif karena memiliki kelas pararel yang begitu banyak. Kalau hanya memiliki satu instrumen saja maka saling mencontek dan kebocoran soal antar murid tidak dapat dihindari. Untuk mengatasi hal tersebut guru membuat tes lebih dari satu perangkat tes.

4. Bahwa perangkat-perangkat tes yang dibuat lebih dari satu tidak menutup kemungkinan memiliki karakterisitik yang berbeda dari segi reliabilitas, validitas, tingkat kesukaran dan juga daya pembedanya.

5. Bahwa sekor-sekor dari perangkat tes yang berbeda jika diperbandingkan sebagai penentuan prestasi peserta didik maka akan memberikan perlakuan yang tidak adil.

6. Bahwa penyetaraan sekor pada saat ini banyak dilakukan dalam pengukuran pembelajaran sains, sangat sulit ditemukan penyetaraan sekor dalam pengukuran bahasa.


(15)

8

C. PEMBATASAN MASALAH

Dari yang telah dikemukakan didalam indentifikasi masalah penelitian mengingat begitu banyak permasalahan yang muncul terhadap evaluasi pembelajaran. Maka penelitian ini dibatasi pada pengukuran hasil belajar siswa terhadap sekor yang berasal dari kedua perangkat tes yang berbeda dikategorikan dengan perangkat tes (X) dan perangkat tes (Y). Dimana kedua perangkat tes ini disusun secara pararel dan memiliki butir anchor (internal).

Butir anchor yang dimaksud adalah butir yang sama yang mana menyebar diantara kedua perangkat tes tersebut. Perangkat tes yang dimaksud adalah perangkat tes Bahasa Inggris yang dibuat dalam bentuk pilihan ganda dengan lima pilihan jawaban. Sebelum dilakukan proses penyetaraan perlu peninjauan terhadap karakteristik kedua instrumen tersebut atau dianalisis untuk menentukan bagaimana reliabilitas, tingkat kesukaran dan daya pembeda dari perangkat tes. Dan juga akan dianalisis tingkat kesukaran dan daya pembeda dari butir anchor tersebut.

Skor-skor mentah yang dihasilkan dari kedua perangkat tes yang berbeda itu dikonversikan dengan penyetaraan sekor dengan arah penyetaraan horizontal dalam metode penyetaraan linier dan menggunakan rancangan common item

nonequivalent groups design.

D. PERUMUSAN MASALAH

Berdasarkan pembatasan masalah diatas maka dapat dirumuskan sebagai berikut:

1. Bagaimanakah karakteristik kedua perangkat tes Bahasa Inggris X dan Y tersebut ?

2. Bagaimanakah persamaan atau rumusan konversi penyetaraan sekor dari dua perangkat tes X dan Y ?


(16)

9

E. TUJUAN PENELITIAN

Adapun tujuan dari penelitian ini adalah untuk:

1. Menganalisikan karakteristik dari kedua perangkat tes Bahasa Inggris X dan Y.

2. Menemukan persamaan konversi penyetaraan sekor dari dua perangkat tes Bahasa Inggris X dan Y.

F. MANFAAT PENELITIAN

Secara teoritis, hasil penelitian ini diharapkan dapat memberikan kontribusi yang menyangkut pengukuran dan evaluasi pendidikan. Hasil penelitian ini juga dapat digunakan sebagai masukan awal bagi peneliti-peneliti lanjutan sebagai bahan kajian untuk mengelaborasi lebih mendalam terhadap variabel yang diteliti, meskipun sedikit hasil penelitian ini dapat memberikan sumbangan. Secara praktis, hasil penelitian ini dapat menjadi masukan bagi para guru-guru bidang studi yang memiliki kelas pararel dalam menyelenggarakan tes, agar dapat membuat tes yang benar-benar mengukur kemampuan siswa yang bisa membedakan antara siswa yang pandai dan tidak pandai. Selain itu dengan penyetaraan sekor dapat memberikan penilaian yang akurat dan memberikan penilaian yang adil buat peserta didiknya


(17)

BAB V

KESIMPULAN DAN SARAN

A. Kesimpulan

Berdasarkan hasil penelitian dan pembahasan yang telah dikemukakan bahwa kedua instrumen X dan Y memiliki karakteristik soal yang tidak sama, baik dari tingkat kesukaran dan juga daya pembeda. Kedua instrumen ini mempunyai data empiris yang cukup baik karena mempunyai tingkat kesukaran rata-rata sedang, dan memiliki kemampuan sedang untuk membedakan antara siswa yang pandai dan tidak pandai. Sementara butir anchor yang tersebar dari kedua perangkat tes X dan Y, berfungsi dengan cukup baik dan berkategori sedang, baik dari tingkat kesukaran dan daya pembeda. Dilihat dari koefisien reliabilitas kedua instrumen ini memiliki tingkat keajegan yang cukup tinggi yaitu 0,84 untuk instrumen X dan 0,87 untuk instrumen Y. Dapat disimpulkan bahwa kedua instrumen ini memiliki koefisien reliabilitas yang tidak terlalu berbeda, karena sama-sama memiliki nilai reliabilitas yang tinggi.

Persamaan atau formula konversi sekor dari dua perangkat tes Bahasa Inggris yaitu instrumen X adalah Y*=0,94(X-51,82)+49,08 dan sebaliknya instrumen Y adalah X*=1,15(Y-49,1)+51. Berdasarkan dari hasil penyetaraan sekor dengan rumusan persamaan konversi ini didapatkan sekor-sekor tes siswa yang setara. Dapat disimpulkan bahwa instrumen Y cukup sukar dibandingkan dengan instrumen X, sebab dari proses perhitungan penyetaraan menggunakan formula persamaan konversi ini atau menggunakan formula dari X ke Y* tersebut menunjukkan bahwa sekor yang berasal dari instrumen X setelah sekor tersebut disetarakan akan mengalami penurunan sekor. Begitu juga sebaliknya dari Y ke X* sekor yang berasal dari instrumen Y, ketika disetarakan akan mengalami kenaikan sekor.


(18)

57

B. Saran

Berdasarkan pembahasan dan kesimpulan yang telah diuraikan sebelumnya, ada beberapa saran yang perlu disampaikan yang berhubungan dengan penyetaraan sekor dan juga hasil penelitian.

1. Peneliti mengharapkan hasil penelitian ini dapat memberikan masukan yang baik bagi semua unsur yang berperan penting dalam bidang pendidikan dimana masalah penyetaraan sekor merupakan hal yang penting untuk dilakukan oleh guru-guru disekolah.

2. Usaha untuk melakukan penyetaraan sekor perlu dimulai dan dilakukan oleh sekolah-sekolah, baik mandiri maupun secara bersama-sama mengingat tren sekarang banyak sekali para pendidik ketika melakukan evaluasi membuat lebih dari satu perangkat tes.

3. Bagi peneliti lanjutan yang tertarik meneliti dalam bidang pengukuran pendidikan, disarankan untuk bisa menindaklanjuti penelitian ini yang berhubungan dengan penyetaraan sekor, menggali lebih dalam lagi terkait dengan metode penyetaraan dengan melibatkan variabel-variabel lain yang relevan.


(19)

DAFTAR PUSTAKA

Ali, Mohammad.2011. Memahami Riset Prilaku dan Sosial. Bandung: Pustaka Cendikia Utama.

Anastasi, Anne and Susan Urbina.1997. Psychological Testing. New Jersey: Prentice-Hall, Inc Company.

Azwar, Syaifuddin.1987. Tes Prestasi Fungsi dan Pengembangan Pengukuran

Prestasi Belajar. Yogyakarta: Pustakan Pelajar offset.

Azwar, Syaifuddin.1999. Dasar-Dasar Psikometri. Yogyakarta: Pustakan Pelajar offset.

Azwar, Syaifuddin.2001. Reliabilitas dan Validitas. Yogyakarta: Pustakan Pelajar offset.

Borg, Walter R and Meredith Damien Gall.1989. Educational Research: An

Introduction Fifth Edition. New York: Longman.

Brata, Sumadi Surya.2002.Pengembangan dan Alat Ukur Psikologis.

Yogyakarta:Andi.

Crocker, Linda and James Algina.1986. Introduction to Classical and Modern

Test Theory. USA: Rinehartand Winston Inc.

Dorans, Neil J, Tim P Moses and Daniel R Eighnor.2010. Research Report:

Principles and Practices of Test Score Equating.

Princeton,NewJersey:ETS.

Furqon.2004.Statistika Terapan untuk Penelitian.Bandung:ALFABETA

Gronlund, N.E. and Linn R L 1990. Measurement and Evaluation in Teaching. New York:Macmilan Co. Inc.

Ida, W. 2010. www.undip.ac.id/24056/3. (13 Januari 2014)

Iteman.1988.MicroCAT (tm) Testing System.Assessmet Systems Corporation Kolen, M. J and R. L Brennan.1995.Test Equating Methods and Practice. New

York:Springer-Verlag New York.Inc.

Mardapi, Djemari.2008. Teknik Penyusunan Instrumen Tes dan Non Tes. Jogjakarta:Mitra Cendikia


(20)

59

Naga, Dali Santun. 2012. Teori Sekor Pada Pengukuran Mental. Jakarta: PT. Nagarani Citrayasa.

Nunnally, Jum C. 1959. Tes and Measurements: Assessment and Prediction. New York: MC Graw-Hill Book Company. Inc

Rasyid, Harun dan Mansyur. 2007. Hasil Belajar. Bandung: CV Wacana Prima. Rijanto, Tri.2011. Pengaruh Metode Penyetaraan Sekor dan Jumlah Sampel

Terhadap Variansi Sekor Hasil Penyetaraan Pada Ujian Akhir Sekolah Berstandar Nasional Mata Pelajaran IPA. Disertasi tidak

dipublikasikan. Jakarta: Pascasarjan Universitas Negeri Jakarta

Rustam.2000. Penyetaraan Perangkat Tes Matematika Program D2 PGSD

Universitas Terbuka.Jakarta:Lembaga Penelitian Universitas Terbuka

Sudaryono.2012.Dasar-dasar Evaluasi Pembelajaran. Yogyakarta: Graha Ilmu. Sugiyono.2009.Metode Penelitian Pendidikan:Pendekatan Kuantitatif, Kualitatif

dan R&D. Bandung:ALFABETA

Supriyati, Yetti. 2003. Pengaruh Proporsi Anchor Items Terhadap Kestabilan

Koefisien Penyetaraan Sekor Pada Evaluasi Belajar. Disertasi tidak

dipublikasikan.Jakarta: Pascasarjana Universitas Negeri Jakarta. Susetyo, Budi.2011. Menyusun Tes Hasil Belajar. Bandung: CV Cakra.

Tumilisar, A.J.V.2005. Akurasi Relatif Penyetaraan Skor Tes Untuk Sampel

Berukuran 300 Ditinjau Dari Metode Penyetaraan dan Teknik Penghalusan.Disertasi tidak dipublikasikan.Jakarta:Pascasarjana Universitas Negeri Jakarta.

Weiss, David J.1983. New Horizons In Testing; Latent Trait Test Theory and

Computerized Adaptive Testing. London:Academic Press.Inc

Wiersman, William and Stephen G. Jurs. 1990. Educational Measurement and

Testing. Massachusetts: Division of Simon Schuster Inc.

Zainul, Asmawi dan Noehl Nasoetion.1993. Bahan Ajar Program Pengembangan Keterampilan Teknik Instruksional (PEKERTI) Untuk Dosen Muda, Penilaian Hasil Belajar. Jakarta: Departemen Pendidikan

dan Kebudayaan PAU PPAI Universitas Terbuka. www.library.upn uj.ac.id.(pdf/S1.fisip’09).(13 Januari 2014)


(21)

BAB III

METODE PENELITIAN

A.Populasi dan Sampel

Menurut Ali (2011:83) populasi pada dasarnya merupakan sumber data secara keseluruhan. Populasi dalam penelitian ini terbagi menjadi dua yaitu populasi responden dan populasi sekor tes responden. Populasi responden yaitu siswa SMA kelas XI di kabupaten Bangka Tengah yaitu SMA 1 Koba, SMA 1 Lubuk Besar, SMA 1 Namang, SMA 1 Pangkalan Baru. Sebanyak 400 orang siswa, yang dibagi menjadi dua yaitu 200 siswa yang mengerjakan instrumen X dan 200 orang siswa yang mengerjakan instrumen Y.

Populasi sekor tes yaitu sekor butir hasil jawaban dari 400 responden yang mengerjakan dua perangkat tes X dan Y pada mata pelajaran Bahasa Inggris. Kedua perangkat tes yang berbeda ini berasal dari kisi-kisi yang sama dan memiliki butir anchor didalamnya.

Sampel dalam penelitian ini adalah sekor yang diambil dari populasi, sekor ini yang akan digunakan dalam proses penyetaraan. Pengambilan sampel data dalam penelitian ini menggunakan teknik cluster random sampling dengan kelompok intack. Menurut Ali (2011:110) teknik ini merupakan teknik penyampelan peluang, dalam penyampelan kluster dilaksanakan perandoman meskipun pelaksanaannya bukan terhadap individu subyek, melainkan terhadap klaster, kumpulan atau kelompok subyek.

B. Metode Penelitian

Penelitian ini termasuk penelitian deskriptif eksploratif. Menurut Sugiono (2009:56) penelitian deskriptif adalah penelitian untuk mengetahui variabel mandiri, baik satu variabel atau lebih (independen), tanpa membuat perbandingan atau menghubungkan variabel yang lain. Eksploratif cenderung untuk belajar variabel dan hubungan mereka dalam rangka untuk lebih memahami fenomena. Menurut Borg dan Meredith (1989:32) ekploratif studi ini cenderung tidak dipandu oleh hipotesis karena peneliti tidak memiliki pemahaman yang memadai tentang fenomena untuk membentuk dugaan tentang hubungan antara konstruk.


(22)

34

Didalam penelitian ini tidak membandingkan variabel, tetapi hanya bersifat menganalisis kedua perangkat tes dan menyetarakan sekor yang berasal dari kedua perangkat tes tersebut.

C. Variabel Penelitian

Variabel dapat didefinisikan sebagai segala sesuatu yang ada dan keberadaannya memiliki lebih dari satu label atau lebih dari satu nilai (Ali, 2011:69). Dalam penelitian ini melibatkan beberapa variabel penelitian yaitu variabel bebas, variabel moderator dan variabel terikat.

Variabel bebas dalam penelitian ini adalah metode linier. Variabel bebas (independent variable) adalah variabel yang kemunculannya diasumsikan menjadi sebab munculnya variabel lain (Ali, 2011:71).

Variabel moderator dalam penyetaraan ini adalah penyetaraan sekor. Variabel moderator adalah variabel yang menjadi perantara bagi variabel bebas dalam memberi pengaruh kepada variabel terikat (Ali, 2011:71).

Variabel terikat dalam penelitian ini adalah sekor hasil penyetaraan.Variabel terikat yang kemunculannya diasumsikan sebagai akibat dari adanya variabel sebab (Ali , 2011:71).

D. Definisi Operasional

1. Perangkat tes pararel yang dimaksud dalam penelitian ini adalah dua perangkat tes Bahasa Inggris yang terdiri dari X dan Y.

2. Butir Anchor yang dimaksud dalam penelitian ini adalah butir yang disisipkan kedalam kedua perangkat tes yang berbeda yang dikategorikan perangkat tes X dan Y. Butir ini memiliki tempat atau posisi yang sama dan jumlah butir yang sama.

3. Penyetaraan sekor yang dimaksud adalah penyetaraan dari sekor mentah yang diperoleh dari perangkat tes yang satu (X) atau (Y) dimana sekor ini akan dikonversikan pada kedua perangkat tes tersebut dengan menggunakan penyetaraan linier dengan metode rancangan D yaitu common item non


(23)

35

E. Instrumen Penelitian

Instrumen yang digunakan dalam penelitian ini berupa tes hasil belajar yang mengacu pada Ujian Tengah Semester (UTS) yang terdiri dari dua perangkat tes X dan Y.

Penyusunan instrumen ini didasarkan pada indikator hasil belajar yang hendak dicapai. Instrumen ini mencakup ranah kognitif pada kemampuan (C1), pemahaman (C2), dan penerapan/aplikasi (C3), yang terdiri dari berbagai soal yang disesuaikan dengan indikator soal.

Adapun langkah-langkah yang telah ditempuh dalam penyusunan kedua instrumen tes X dan Y pada Ujian Tengah Semester (UTS) adalah sebagai berikut: a. Menentukan konsep berdasarkan kurikulum yang berlaku untuk mata pelajaran Bahasa Inggris di sekolah – sekolah tempat penelitian berlangsung. b. Membuat kisi-kisi soal berdasarkan kurikulum untuk mata pelajaran Bahasa

Inggris kelas XI SMA semester dua dengan materi pokok berupa teks Narrative, teks Spoof, teks Hortatory Exposition serta kebahasaan dan ungkapan bahasa yang berhubungan dengan teks tersebut.

c. Membuat soal tes berdasarkan kisi-kisi dan membuat kunci jawaban.

F. Prosedur Penelitian

Prosedur penelitian yang telah dilakukan meliputi beberapa tahap meliputi:

1. Membuat soal Bahasa Inggris

Penulis menyusun rancangan instrumen pengukuran sementara terlebih dahulu. Penyusunan instrumen sementara berpedoman kepada kurikulum yang ada dan berdasarkan kisi – kisi tes yang telah dirancang terlebih dahulu. Penulis memilih pokok bahasan teks Narrative, teks Spoof dan teks Hortatory Exposition serta kebahasaan dan ungkapan bahasa yang berhubungan dengan teks tersebut. Yang pelajari oleh siswa kelas XI SMA. Pada rancangan instrumen ini penulis membuat sebanyak 45 butir tes.


(24)

36

2. Uji validitas butir soal

Validitas butir soal diuji dengan judment ahli yang bertujuan untuk melihat kecocokan antara butir tes yang dikembangkan dengan indikator yang telah ditetapkan sebelumnya. Judment dilakukan oleh 9 orang yang terdiri dari guru Bahasa Inggris.

3. Melakukan uji coba soal

Butir tes yang telah dinilai oleh ahli dan telah dinyatakan valid dan memiliki kecocokan antara butir tes yang telah dibuat dengan indikator yang telah ditetapkan sebelumnya di uji terlebih dahulu untuk melihat daya beda, tingkat kesukaran dan reliabilitasnya. Pengujian instrumen dilakukan di SMA 1 Pangkalan Baru.

4. Melakukan analisis butir

Pada tahap ini peneliti melakukan analisis terhadap daya beda, tingkat kesukaran dan reliabilitas tes secara kuantitatif. Hal ini bertujuan untuk mendapatkan butir tes yang valid dan reliabel.

5. Meletakkan butir anchor kedalam kedua perangkat tes tersebut

Menyisipkan butir anchor pada instrumen yang telah memenuhi persyaratan tersebut. Butir anchor yang akan digunakan diambil dari soal-soal ujian nasional, karena dianggap telah standar dan divalidasi oleh tim BNSP. Butir anchor ini diadaptasikan dengan pokok bahasan kelas XI pada semester genap, Butir anchor yang dimaksud memiliki SK dan KD yang sama indikator yang setara dengan butir non anchor. Butir anchor yang digunakan adalah 20% dari panjang tes keseluruhan. Satu instrumen terdiri 35 butir soal, jadi 28 butir non

anchor 7 butir anchor item.

6. Menguji butir tes yang valid, reliabel dan telah disisipkan butir anchor di kelas penelitian

Penelitian ini dilakukan di SMA 1 Koba, SMA 1 Lubuk Besar, SMA 1 Namang. Responden yang diambil sebanyak 400 orang siswa kelas XI. Setelah tes diujikan di kelas penelitian kemudian dilakukan penyekoran terhadap hasil tes siswa.


(25)

37

7. Setelah sekor didapat maka akan dilanjutkan dengan penyetaraan sekor dengan menggunakan metode penyetaraan linier dengan rancangan D.

ALUR PROSEDUR PENELITIAN

Diujikan

Didapat

Diujikan

Hasil

Disetarakan

---

Gambar 3.1. Alur Penelitian

Membuat soal Bahasa Inggris X dan Y

Uji Validitas Butir Soal

Kelas Uji Coba

Reliabilitas, Tingkat Kesukaran dan Daya Pembeda

Butir Soal Bahasa Inggris yang Valid dan Reliabel

Kelas Penelitian

Sekor


(26)

38

G. Teknik Pengumpulan Data

Pengumpulan data dalam penelitian ini adalah dengan cara memberikan instrumen yang telah di ujicoba kepada responden yaitu siswa SMA kelas XI. Selanjutnya hasil tes yang berupa skor-skor yang diperoleh dari responden inilah yang akan dijadikan subjek penelitian. Prosedur pengumpulan data melalui tahap

– tahap sebagai berikut:

Perangkat tes yang dibuat pararel yaitu tes Bahasa Inggris X dan Y dengan butir anchor yang menyebar pada kedua perangkat tersebut..

1. Untuk masing – masing siswa ada yang mengerjakan tes X dan Y. 2. Responden menjawab pada lembar jawaban yang telah disediakan.

3. Sekor yang diperoleh dari 400 orang siswa (sekor responden) 200 sekor tes X dan 200 sekor tes Y.

H. Teknik Analisis Data

Pengolahan data pada penelitian ini diawali dengan:

1. Menghitung reliabilitas

Pada tahap ini adalah menghitung reliabilitas dari perangkat tes X dan perangkat tes Y yang telah disisipkan butir anchor pada kedua perangkat tersebut. Reliabilitas instrumen adalah ketepatan alat ukur dalam mengukur atau ketepatan siswa dalam menjawab alat ukur itu. Suatu tes dapat dikatakan memiliki taraf reliabilitas yang tinggi jika tes tersebut dapat memberikan hasil tetap yang dihitung dengan koefesien reliabilitas.

Pada penelitian ini sekor berupa dikotomi yaitu sekor tes hasil belajar siswa yang diperoleh dalam penelitian, karena bobot soal yang diberikan bernilai 1 untuk soal yang dijawab benar dan bernilai 0 untuk soal yang dijawab salah. Menghitung reliabilitas tes pada penelitian ini dilakukan dengan menggunakan

software ITEMAN MICROCAT Versi 3.0

2. Tingkat Kesukaran

Tingkat kesukaran adalah bilangan yang menunjukkan sukar atau mudahnya suatu soal. Besarnya indeks kesukaran berkisar antara 0,0 sampai 1,00. Soal dengan indeks kesukaran 0,0 menunjukkan bahwa soal tersebut terlalu sukar, sebaliknya indeks 1,00 menunjukkan bahwa soal tersebut terlalu mudah.


(27)

39

Indeks kesukaran diberi simbol P (proporsi) yang dihitung dengan rumus (Susetyo, 2011) :

(3.1) Keterangan:

P : Tingkat kesukaran

B : Banyaknya siswa yang menjawab soal itu dengan benar JS : Jumlah seluruh siswa peserta tes

Kriteria indeks kesukaran suatu tes menurut Witherington adalah sebagai berikut:

Tabel 3.1 Kriteria Indeks Kesukaran

Batasan Kategori

0,00 ≤ P < 0,30 Soal sukar

0,30 ≤ P < 0,70 Soal sedang

0,70 ≤ P ≤ 1,00 Soal mudah

Perhitungan tingkat kesukaran kedua perangkat tes tersebut maka akan dilakukan dengan bantuan software ITEMAN MICROCAT Versi 3.0.

3. Daya Pembeda

Daya beda (D) butir tes adalah kemampuan butir tes untuk mengetahui seberapa besar suatu butir tes dapat membedakan (diskriminasi) antara peserta tes yang berkemampuan tinggi dengan peserta tes yang berkemampuan rendah.

Pada penelitian ini perhitungan daya beda dilakukan dengan cara menghitung koefisien biserial titik. Korelasi butir – total merupakan korelasi yang didasarkan pada sekor butir dan sekor total untuk semua butir yang dijawab benar. Untuk menguji validitas setiap butir soal, skor tiap butir soal yang dimaksud dikorelasikan dengan skor total. Sebuah soal akan memiliki validitas tinggi jika skor soal tersebut memiliki dukungan yang besar terhadap skor total. Dukungan setiap butir soal dinyatakan dalam bentuk korelasi, sehingga untuk mendapatkan validitas suatu butir soal digunakan rumus korelasi.

Perhitungan korelasi butir – total untuk data dengan sekor dikotomi menggunakan koefisien korelasi point biserial. Adapun rumus yang digunakan adalah rumus korelasi point biserial (Susetyo, 2011:165) :


(28)

40

√ (3.2)

Keterangan:

: Validitas butir total/ daya beda

: Rata – rata sekor total responden yang menjawab benar

: Rata – rata sekor total responden yang menjawab salah

: Proporsi jawaban benar butir tes tertentu : Proporsi jawaban salah butir tes tertentu

: Standar deviasi sekor total semua responden

Ada ketentuan yang dapat digunakan dalam menetapkan daya beda pada suatu butir tes. Menurut Nunnally koefisien korelasi diatas 0.20 sudah dianggap cukup baik. Perhitungan daya beda butir pada kedua perangkat tes X dan Y ini akan dilakukan dengan bantuan software ITEMAN MICROCAT Versi 3.0

4. Penyetaraan Sekor

Selanjutnya menganalisis skor dengan melakukan penyetaraan sekor yang diperoleh dari perangkat tes X dan Y, yang mana penyetaraan sekor akan dianalisis menggunakan program Excell. Pertama menghitung jumlah sekor mentah yang diperolah dari kedua perangkat tes X dan Y, dengan cara mengelompokkan sekor anchor item dan sekor non anchor item. Dari pengelompokkan tersebut dilanjutkan dengan perhitungan statistik yaitu mencari jumlah rata-rata, simpangan baku perangkat tes yang satu dan perangkat tes yang lain juga beserta anchor. Kemudian disetarakan dengan menggunakan penyetaraan linier rancangan D untuk memudahkan perhitungan, maka analisis penyetaraan sekor ini menggunakan program Excell.


(1)

E. Instrumen Penelitian

Instrumen yang digunakan dalam penelitian ini berupa tes hasil belajar yang mengacu pada Ujian Tengah Semester (UTS) yang terdiri dari dua perangkat tes X dan Y.

Penyusunan instrumen ini didasarkan pada indikator hasil belajar yang hendak dicapai. Instrumen ini mencakup ranah kognitif pada kemampuan (C1), pemahaman (C2), dan penerapan/aplikasi (C3), yang terdiri dari berbagai soal yang disesuaikan dengan indikator soal.

Adapun langkah-langkah yang telah ditempuh dalam penyusunan kedua instrumen tes X dan Y pada Ujian Tengah Semester (UTS) adalah sebagai berikut: a. Menentukan konsep berdasarkan kurikulum yang berlaku untuk mata pelajaran Bahasa Inggris di sekolah – sekolah tempat penelitian berlangsung. b. Membuat kisi-kisi soal berdasarkan kurikulum untuk mata pelajaran Bahasa

Inggris kelas XI SMA semester dua dengan materi pokok berupa teks Narrative, teks Spoof, teks Hortatory Exposition serta kebahasaan dan ungkapan bahasa yang berhubungan dengan teks tersebut.

c. Membuat soal tes berdasarkan kisi-kisi dan membuat kunci jawaban. F. Prosedur Penelitian

Prosedur penelitian yang telah dilakukan meliputi beberapa tahap meliputi:

1. Membuat soal Bahasa Inggris

Penulis menyusun rancangan instrumen pengukuran sementara terlebih dahulu. Penyusunan instrumen sementara berpedoman kepada kurikulum yang ada dan berdasarkan kisi – kisi tes yang telah dirancang terlebih dahulu. Penulis memilih pokok bahasan teks Narrative, teks Spoof dan teks Hortatory Exposition serta kebahasaan dan ungkapan bahasa yang berhubungan dengan teks tersebut. Yang pelajari oleh siswa kelas XI SMA. Pada rancangan instrumen ini penulis membuat sebanyak 45 butir tes.


(2)

2. Uji validitas butir soal

Validitas butir soal diuji dengan judment ahli yang bertujuan untuk melihat kecocokan antara butir tes yang dikembangkan dengan indikator yang telah ditetapkan sebelumnya. Judment dilakukan oleh 9 orang yang terdiri dari guru Bahasa Inggris.

3. Melakukan uji coba soal

Butir tes yang telah dinilai oleh ahli dan telah dinyatakan valid dan memiliki kecocokan antara butir tes yang telah dibuat dengan indikator yang telah ditetapkan sebelumnya di uji terlebih dahulu untuk melihat daya beda, tingkat kesukaran dan reliabilitasnya. Pengujian instrumen dilakukan di SMA 1 Pangkalan Baru.

4. Melakukan analisis butir

Pada tahap ini peneliti melakukan analisis terhadap daya beda, tingkat kesukaran dan reliabilitas tes secara kuantitatif. Hal ini bertujuan untuk mendapatkan butir tes yang valid dan reliabel.

5. Meletakkan butir anchor kedalam kedua perangkat tes tersebut

Menyisipkan butir anchor pada instrumen yang telah memenuhi persyaratan tersebut. Butir anchor yang akan digunakan diambil dari soal-soal ujian nasional, karena dianggap telah standar dan divalidasi oleh tim BNSP. Butir anchor ini diadaptasikan dengan pokok bahasan kelas XI pada semester genap, Butir anchor yang dimaksud memiliki SK dan KD yang sama indikator yang setara dengan butir non anchor. Butir anchor yang digunakan adalah 20% dari panjang tes keseluruhan. Satu instrumen terdiri 35 butir soal, jadi 28 butir non

anchor 7 butir anchor item.

6. Menguji butir tes yang valid, reliabel dan telah disisipkan butir anchor di kelas penelitian

Penelitian ini dilakukan di SMA 1 Koba, SMA 1 Lubuk Besar, SMA 1 Namang. Responden yang diambil sebanyak 400 orang siswa kelas XI. Setelah tes diujikan di kelas penelitian kemudian dilakukan penyekoran terhadap hasil tes siswa.


(3)

7. Setelah sekor didapat maka akan dilanjutkan dengan penyetaraan sekor dengan menggunakan metode penyetaraan linier dengan rancangan D.

ALUR PROSEDUR PENELITIAN

Diujikan

Didapat

Diujikan

Hasil

Disetarakan

---

Gambar 3.1. Alur Penelitian Membuat soal Bahasa Inggris X dan Y

Uji Validitas Butir Soal

Kelas Uji Coba

Reliabilitas, Tingkat Kesukaran dan Daya Pembeda

Butir Soal Bahasa Inggris yang Valid dan Reliabel

Kelas Penelitian

Sekor


(4)

G. Teknik Pengumpulan Data

Pengumpulan data dalam penelitian ini adalah dengan cara memberikan instrumen yang telah di ujicoba kepada responden yaitu siswa SMA kelas XI. Selanjutnya hasil tes yang berupa skor-skor yang diperoleh dari responden inilah yang akan dijadikan subjek penelitian. Prosedur pengumpulan data melalui tahap – tahap sebagai berikut:

Perangkat tes yang dibuat pararel yaitu tes Bahasa Inggris X dan Y dengan butir anchor yang menyebar pada kedua perangkat tersebut..

1. Untuk masing – masing siswa ada yang mengerjakan tes X dan Y. 2. Responden menjawab pada lembar jawaban yang telah disediakan.

3. Sekor yang diperoleh dari 400 orang siswa (sekor responden) 200 sekor tes X dan 200 sekor tes Y.

H. Teknik Analisis Data

Pengolahan data pada penelitian ini diawali dengan: 1. Menghitung reliabilitas

Pada tahap ini adalah menghitung reliabilitas dari perangkat tes X dan perangkat tes Y yang telah disisipkan butir anchor pada kedua perangkat tersebut. Reliabilitas instrumen adalah ketepatan alat ukur dalam mengukur atau ketepatan siswa dalam menjawab alat ukur itu. Suatu tes dapat dikatakan memiliki taraf reliabilitas yang tinggi jika tes tersebut dapat memberikan hasil tetap yang dihitung dengan koefesien reliabilitas.

Pada penelitian ini sekor berupa dikotomi yaitu sekor tes hasil belajar siswa yang diperoleh dalam penelitian, karena bobot soal yang diberikan bernilai 1 untuk soal yang dijawab benar dan bernilai 0 untuk soal yang dijawab salah. Menghitung reliabilitas tes pada penelitian ini dilakukan dengan menggunakan

software ITEMAN MICROCAT Versi 3.0

2. Tingkat Kesukaran

Tingkat kesukaran adalah bilangan yang menunjukkan sukar atau mudahnya suatu soal. Besarnya indeks kesukaran berkisar antara 0,0 sampai 1,00. Soal dengan indeks kesukaran 0,0 menunjukkan bahwa soal tersebut terlalu sukar, sebaliknya indeks 1,00 menunjukkan bahwa soal tersebut terlalu mudah.


(5)

Indeks kesukaran diberi simbol P (proporsi) yang dihitung dengan rumus (Susetyo, 2011) :

(3.1) Keterangan:

P : Tingkat kesukaran

B : Banyaknya siswa yang menjawab soal itu dengan benar JS : Jumlah seluruh siswa peserta tes

Kriteria indeks kesukaran suatu tes menurut Witherington adalah sebagai berikut: Tabel 3.1 Kriteria Indeks Kesukaran

Batasan Kategori

0,00 ≤ P < 0,30 Soal sukar

0,30 ≤ P < 0,70 Soal sedang

0,70 ≤ P ≤ 1,00 Soal mudah

Perhitungan tingkat kesukaran kedua perangkat tes tersebut maka akan dilakukan dengan bantuan software ITEMAN MICROCAT Versi 3.0.

3. Daya Pembeda

Daya beda (D) butir tes adalah kemampuan butir tes untuk mengetahui seberapa besar suatu butir tes dapat membedakan (diskriminasi) antara peserta tes yang berkemampuan tinggi dengan peserta tes yang berkemampuan rendah.

Pada penelitian ini perhitungan daya beda dilakukan dengan cara menghitung koefisien biserial titik. Korelasi butir – total merupakan korelasi yang didasarkan pada sekor butir dan sekor total untuk semua butir yang dijawab benar. Untuk menguji validitas setiap butir soal, skor tiap butir soal yang dimaksud dikorelasikan dengan skor total. Sebuah soal akan memiliki validitas tinggi jika skor soal tersebut memiliki dukungan yang besar terhadap skor total. Dukungan setiap butir soal dinyatakan dalam bentuk korelasi, sehingga untuk mendapatkan validitas suatu butir soal digunakan rumus korelasi.

Perhitungan korelasi butir – total untuk data dengan sekor dikotomi menggunakan koefisien korelasi point biserial. Adapun rumus yang digunakan adalah rumus korelasi point biserial (Susetyo, 2011:165) :


(6)

√ (3.2) Keterangan:

: Validitas butir total/ daya beda

: Rata – rata sekor total responden yang menjawab benar : Rata – rata sekor total responden yang menjawab salah : Proporsi jawaban benar butir tes tertentu

: Proporsi jawaban salah butir tes tertentu : Standar deviasi sekor total semua responden

Ada ketentuan yang dapat digunakan dalam menetapkan daya beda pada suatu butir tes. Menurut Nunnally koefisien korelasi diatas 0.20 sudah dianggap cukup baik. Perhitungan daya beda butir pada kedua perangkat tes X dan Y ini akan dilakukan dengan bantuan software ITEMAN MICROCAT Versi 3.0

4. Penyetaraan Sekor

Selanjutnya menganalisis skor dengan melakukan penyetaraan sekor yang diperoleh dari perangkat tes X dan Y, yang mana penyetaraan sekor akan dianalisis menggunakan program Excell. Pertama menghitung jumlah sekor mentah yang diperolah dari kedua perangkat tes X dan Y, dengan cara mengelompokkan sekor anchor item dan sekor non anchor item. Dari pengelompokkan tersebut dilanjutkan dengan perhitungan statistik yaitu mencari jumlah rata-rata, simpangan baku perangkat tes yang satu dan perangkat tes yang lain juga beserta anchor. Kemudian disetarakan dengan menggunakan penyetaraan linier rancangan D untuk memudahkan perhitungan, maka analisis penyetaraan sekor ini menggunakan program Excell.