Karakteristik Psikometri Subtes Rechenaufgaben (RA) Pada Intelligenz Struktur Test (IST)

(1)

TEST (IST)

SKRIPSI

Diajukan untuk memenuhi persyaratan Ujian Sarjana Psikologi

Oleh:

KIKI FATMALA SARI

071301068

FAKULTAS PSIKOLOGI

UNIVERSITAS SUMATERA UTARA

GENAP, 2010/2011


(2)

RECHENAUFGABEN (RA) PADA INTELLIGENZ STRUKTUR

TEST (IST)

Dipersiapkan dan disusun oleh:

KIKI FATMALA SARI 071301068

Telah dipertahankan di depan Dewan Penguji Pada tanggal 15 Maret 2011

Mengesahkan, Dekan Fakultas Psikologi

Prof. Dr. Irmawati, Psikolog NIP. 19530131980032001

Tim Penguji

1. Etty Rahmawati, M.Si. Penguji I/Pembimbing NIP. 198107252008012013

2. Ika Sari Dewi, S.Psi.,psikolog Penguji II

NIP. 197809102005012001

3. Eka Danta Jaya G., M.A Penguji III NIP. 197308192001121001


(3)

sesungguhnya bahwa skripsi saya yang berjudul :

Karakteristik Psikometri Subtes

Rechenaufgaben (RA) Pada Intelligenz Struktur Test (IST)

adalah hasil karya sendiri dan belum pernah diajukan untuk memperoleh gelar kesarjanaan di Fakultas Psikologi Universitas Sumatera Utara.

Adapun bagian-bagian tertentu dalam penulisan skripsi ini saya kutip dari hasil karya orang lain yang telah dituliskan sumbernya secara jelas sesuai dengan norma, kaidah, dan etika penulisan ilmiah.

Apabila di kemudian hari ditemukan adanya kecurangan di dalam skripsi ini, saya bersedia menerima sanksi dari Fakultas Psikologi Universitas Sumatera Utara sesuai dengan peraturan yang berlaku.

Medan, Maret 2011

Kiki Fatmala Sari NIM 071301068


(4)

ABSTRAK

Intelligenz Struktur Test (IST) merupakan salah satu tes inteligensi yang sering digunakan untuk seleksi karyawan dalam jumlah besar oleh P3M Fakultas Psikologi USU. IST yang digunakan adalah IST adaptasi UNPAD tahun 1970-an yang belum pernah dievaluasi secara psikometri oleh P3M Fakultas Psikologi USU. Usia IST yang tidak mudah dan rendahnya pengawasan terhadap kerahasiaan tes mengakibatkan IST tidak reliabel dan valid lagi dalam mengukur kemampuan inteligensi individu. Padahal, seperangkat tes yang berkualitas baik secara psikometri merupakan salah satu syarat mutlak yang harus dipenuhi agar proses pengukuran serta penggunaan hasil pengukuran dapat dipercaya. Oleh karena itu, diperlukan evaluasi terhadap IST, khususnya subtes RA.

Tujuan dari penelitian ini adalah untuk melihat apakah subtes RA masih mampu mengungkap fungsi ukurnya sesuai dengan tujuan subtes RA disusun melalui analisis karakteristik psikometri mencakup analisis indeks kesukaran aitem, indeks diskriminasi aitem, reliabilitas, serta validitas konstrak subtes RA tersebut.

Metode pengumpulan data yang digunakan pada penelitian ini adalah metode dokumentasi, yaitu dengan menggunakan data yang didokumentasikan oleh P3M Fakultas Psikologi USU. Data tersebut berupa respon subjek terhadap subtes RA pada lembar jawaban IST yang diperoleh dari 2011 subjek. Hasil penelitian secara keseluruhan, dengan menggunakan pendekatan teori tes klasik dan berdasarkan tujuan IST, khususnya subtes RA sebagai salah satu tes inteligensi ditemukan bahwa dari total 20 aitem pada subtes RA, 16 aitem yang dianggap baik berdasarkan indeks diskriminasinya. Berdasarkan koefisien reliabilitasnya dan nilai koefisien reliabilitas yang baik untuk tes inteligensi menurut Murphy & Davidshofer (2003) adalah ≥ 0,90, subtes RA dianggap kurang reliabel dalam mengukur fungsi ukurnya karena hanya memiliki koefisien reliabilitas sebesar 0,851. Selain itu, berdasarkan analisis validitas konstraknya, subtes RA tidak lagi berfungsi sebagaimana tujuan awal subtes ini di susun. Pada akhirnya penelitian ini menggambarkan bahwa perlunya peninjauan ulang terhadap aitem-aitem subtes RA sebelum digunakan sebagai tes inteligensi, khususnya pada individu dengan latar belakang pendidikan SMA, D3, dan S1.

Kata Kunci : karakteristik psikometri, teori tes klasik, IST, subtes RA

1

Mahasiswa Fakultas Psikologi Universitas Sumatera Utara

2

Dosen Departemen Umum & Eksperimen Fakultas Psikologi Universitas Sumatera Utara


(5)

ABSTRACT

Intelligenz Struktur Test (IST) is one of the intelligence tests that are often used for selection a large number of employees and conducted by P3M Psychology Faculty of USU. The IST is adopted from UNPAD in the 1970s that has never been evaluated psychometrically by P3M Psychology Faculty of USU. The longterm using of IST and low control over the confidentiality of test result is not reliable and valid in measuring individual intelligence. In fact, the tests that has good quality psychometrically is one of necessary condition that must be met for measurement and using of trusted measurement results. Therefore, it is necessary to evaluate the IST, especially the RA subtest.

The aim of this study is to see if RA subtest is still able to reveal the measuring function in accordance with the objectives of RA subtest that is created by analysis of psychometric characteristics includes the analysis of difficulty item index, discrimination item index, reliability, and validity construct of the the RA subtest.

The method of data collection that is used in this study is a documentation method, by using the data documented by the P3M Psychology Faculty of USU as 2011 answer sheets of IST subject. With using classical test theory (CTT) and based on the purpose of IST as a test selection of large number of employees , the result of this study showed the total of 20 items on RA subtest, only 16 items are considered as good item. From the coefficient of reliability and good reliability coefficients for tests of intelligence according to Murphy & Davidshofer (2003), RA subtest was considered less reliable in measuring the measurement function because it only has a reliability coefficient of 0.851. In addition, Based on validity, RA subtest is no longer serve as the initial aim of this subtest designed. At last, this study showed that it is necessary to review of the items of RA subtest before being used as intelligence tests to an individual, especially in individuals with educational backgrounds from high school, D3, and S1.

Keywords : psychometric characteristics, classical test theory, IST, subtestRA

1

Student of Psychology Faculty , Sumatera Utara University

2

Lecturer Department of General and Experimental of Psychology Faculty, Sumatera Utara University


(6)

Puji syukur senantiasa penulis panjatkan kehadirat Allah SWT atas segala limpahan rahmat, karunia dan kekuatan dalam penyelesaikan skripsi ini serta terima kasih telah memberikan penulis orang tua yang sangat luar biasa, Zulfarizal dan Ernawilis, yang selama ini menjadi motivasi penulis untuk bisa menjadi yang terbaik bagi mereka. Mereka selalu memotivasi penulis dalam proses pendidikan yang penulis jalani sampai penyelesaian skripsi ini.

Judul Penyusunan skripsi ini adalah: “Karakteristik Psikometri Subtes

Rechenaufgaben (RA) Pada Intelligenz Struktur Test (IST)”. Skripsi ini disusun dalam rangka memenuhi salah satu syarat untuk mencapai gelar Sajana Psikologi Fakultas Psikologi Universitas Sumatera Utara Medan.

Penulis menyadari bahwa tanpa bantuan dan bimbingan dari berbagai pihak, baik dari masa perkuliahan sampai pada penyusunan skripsi ini sangatlah sulit bagi penulis untuk dapat menyelesaikan penulisan skripsi ini. Oleh karena itu, penulis mengucapkan terimakasih kepada:

1. Prof. Dr. Irmawati, Psikolog selaku Dekan Fakultas Psikologi.

2. Ibu Etty Rahmawati, M.Si selaku dosen pembimbing dan penguji skripsi ini yang telah banyak menyediakan waktu, tenaga, dan pikiran dalam membimbing dan motivasi penulis.

3. Ibu Lily Garliah, M.Si dan Ibu Ika Sari Dewi, S.Psi., Psikolog selaku dosen penguji seminar yang telah memberikan masukan dan dukungan.


(7)

skripsi ini.

5. Ibu Liza Marini, M.Psi. selaku dosen pembimbing akademik selama peneliti kuliah di Fakultas Psikologi USU yang telah membimbing dan memberikan saran kepada peneliti dalam proses perkuliahan.

6. Semua staf pengajar dan pegawai Fakultas Psikologi USU yang selalu memberikan ilmunya kepada penulis dan membantu penulis dalam proses pendidikan dan menyelesaikan skripsi ini.

7. Pihak P3M Fakultas Psikologi USU yang telah bersedia diwawancarai dan memberikan izin kepada peneliti untuk menggunakan dokumentasi data IST. 8. Erlina Desi Purwanti, Da Wewen, Bang David selaku kakak yang selalu

memberikan bantuan dan motivasi kepada penulis selama proses awal pendidikan sampai penulis bisa menyelesaikan skripsi ini. Agra dan Yazeed selaku adek yang telah mengisi hari-hari peneliti dengan kebahagian.

9. Nang Nia selaku kakak yang selalu sabar mendengarkan keluh kesah, selalu memberikan semangat, kasih sayang dan memanjakan peneliti. Miss you Sis. 10. Kak Rena Elvira, Fitri Susanti, Dermika dan Princen selaku rekan yang

sama-sama mengikuti penelitian payung IST atas kerjasama-sama, bantuan, motivasi dan masukan yang diberikan selama ini.

11. Kak Sofi selaku kakak kos selama tiga setengah tahun terakhir ini yang telah banyak membantu dan memberi masukan selama penulis menjalani proses


(8)

12. Adela Eka Putra Marza, Thanks a lot, love you. I am speechless for you. 13. Nana Z. Siregar selaku sahabat dan teman satu Pembimbing Akademik (PA)

yang telah banyak membantu dan menemani penulis dalam permasalahan KRS, pembayaran uang kuliah, dan banyak hal lain yang tidak dapat penulis sebutkan satu persatu. Selanjutnya, sahabat-sahabat yang baik hati lainya (Massita Ozar, Vety Dazefa, Khairiah Mulia Rahma, Nuzulia Rahmati, Zulfadilah Nst., dan Ridya Tyastiti) yang telah banyak membantu dan berbagi suka dan duka selama masa perkuliahan. Semoga pertemanan ini terpelihara indah sampai nantinya. Love you all. Dan, Vet, terima kasih atas foto-foto ucapan selamat ultahnya ya.

14. Riva Perlia Asmi selaku teman yang telah mengirimkan makalah dan Diktat kuliah IST dari Bandung ke Medan. Makalah dan Diktat tersebut menjadi lansadan teori tentang IST bagi penulis dan 4 orang teman lainnya yang juga meneliti tentang IST.

15. Sahabat-sahabat yang selalu memberikan semangat kepada peneliti, yaitu Yessi (Cuyes), Dini, Nenek, Bunda Wiry, & Nyak Ririn. Sahabat-sahabat dikampung, yaitu Jeli, Mela, Mega, Vanny, dan Nining.

16. Uda-uda, Uni-uni, Kawan-kawan serta Adiak-adiak satu kampung yang telah banyak membantu dan memberikan warna yang berbeda dalam hidup penulis selama penulis hidup di Medan. Terima kasih atas kesempatan dan


(9)

17. Seterusnya terima kasih kepada semua pihak yang tidak dapat penulis sebutkan satu persatu, yang telah banyak memberikan dukungan kepada penulis dalam menyelesaikan proposal skripsi ini.

Semoga Allah SWT memberikan balaasan atas segala bantuan yang diberikan selama penulis menjalani pendidikan dan dalam penyusunan skripsi ini.

Penulis menyadari bahwa skripsi ini masih jauh dari sempurna. Untuk itu penulis meminta maaf dan mengharapkan masukan yang membangun sehingga pelaporan hasil penelitian ini menjadi lebih baik lagi di masa yang akan datang. Akhir kata penulis berharap skripsi ini dapat bermanfaat bagi kita semua.

Medan, Maret 2011 Peneliti


(10)

HALAMAN PENGESAHAN……….ii

PERNYATAAN KEASLIAN SKRIPSI……..………..…iii

ABSTRAK………..iv

KATA PENGANTAR…...……….vi

DAFTAR ISI………x

DAFTAR TABEL……….xiv

DAFTAR RUMUS………...xv

DAFTAR LAMPIRAN……….xvi

BAB I PENDAHULUAN A. Latar Belakang Masalah... 1

B. Identifikasi Masalah ... 9

C. Rumusan Masalah... 10

D. Tujuan Penelitian ... 10

E. Manfaat Penelitian ... 11

1. Manfaat Teoritis ... 11

2. Manfaat Praktis ... 11

BAB II TINJAUAN PUSTAKA A. Classical Test Theory (CTT)... 14

1. Pengertian CTT ...14


(11)

1. Indeks Kesukaran Aitem...…………... 18

a. Pengertian Indeks Kesukaran Aitem ...…………... 18

b. Analisis Indeks Kesukaran Aitem ... 20

2. Indeks Diskriminasi Aitem ...…...22

a. Pengertian Indeks Diskriminasi Aitem……...22

b. Analisis Indeks Diskriminasi Aitem ...………...23

3. Reliabilitas Alat Ukur……... 26

a. Pengertian Reliabilitas.………... 26

b. Bentuk Estimasi Reliabilitas ... 27

c. Interpretasi Koefisien Reliabilitas ... 36

d. Faktor-faktor yang Mempengaruhi Koefisien Reliabilitas ... 38

4. Validitas ... 40

a. Pengertian Validitas ... 40

b. Jenis-Jenis Validitas ... 41

c. Interpretasi Koefisien Validitas………..44

C. Analisis Karakteristik Psikometri Alat Ukur...45

D. Intelligenz-Struktur-Test (IST)... 47

1. Sejarah dan Perkembangan ………... 47

2. Fungsi dan Tujuan IST.………... 50

3. Subtes-subte dalam IST……….50

4. Skoring dan Interpretasi………52


(12)

BAB III METODE PENELITIAN

A. Data yang Digunakan...……... 55

B. Subjek Penelitian ... 55

C. Metode Pengumpulan Data...………... 56

D. Persiapan dan Pelaksanaan Penelitian ... 56

1. Persiapan Izin Penelitian ....…... 56

2. Pelaksanaan Penelitian... 56

E. Program Komputer yang Digunakan ... 57

F. Analisis Data ... 58

BAB IV HASIL DAN PEMBAHASAN A. Deskripsi Hasil……...……... 60

1. Analisis Indeks Kesukaran Aitem... 60

2. Analisis Indeks Diskriminasi Aitem... 62

3. Analisis Reliabilitas Subtes RA…...63

4. Analisis Validitas Konstrak Subtes RA... 64

5. Analisis Berdasarkan Karakteristik Psikometri………66

B. Pembahasan….……...……... 67

1. Analisis Indeks Kesukaran Aitem... 67

2. Analisis Indeks Diskriminasi Aitem... 68

3. Analisis Reliabilitas Subtes RA…... 69


(13)

BAB V KESIMPULAN DAN SARAN

A. Kesimpulan…………...……... 75

B. Saran ...………... 76

1. Saran Praktis………... 76

2. Saran Penelitian………... 77

DAFTAR PUSTAKA………78


(14)

Tabel 1. Kategori Nilai p………...21

Tabel 2. Evaluasi Indek Diskriminasi Aitem………24

Tabel 3. Kategori Nilai Estimasi Koefisien Reliabilitas………...38

Tabel 4. Gambaran Umum Subjek Penelitian Berdasarkan Jenis Kelamin……..55

Tabel 5. Hasil Analisis Indeks Kesukaran Aitem Subtes RA….………..61

Tabel 6. Pengelompokan p Subtes RA……….….61

Tabel 7. Hasil Analisis Indek Diskriminasi Aitem Subtes RA…………...……..62

Tabel 8. Evaluasi d Subtes RA………..………....……63

Tabel 9. Matriks Korelasi Antar Subtes pada IST.……….….…..65

Tabel 10. Korelasi Subtes RA dengan 8 Subtes Lainnya..…...……….65

Tabel 11. Nilai p dan d Subtes RA…………...………...………..66


(15)

Rumus 1 Asumsi I……….………15

Rumus 2 Asumsi II………15

Rumus 3 Asumsi III………..………15

Rumus 4 Asumsi IV……….……….16

Rumus 5 Asumsi V……….…………..16

Rumus 6 Indeks Kesukaran Aitem………18

Rumus 7 Hubungan Indeks Kesukaran Aitem dan Rata-rata………19

Rumus 8 Rata-rata Indeks Kesukaran Aitem………19

Rumus 9 Indeks Diskriminasi Aitem………22

Rumus 10 Indeks Diskriminasi Aitem dengan nilai p………...23

Rumus 11 Spearman-Brown……….…31

Rumus 12 Koefisien Alpha………...32

Rumus 13 Koefisien Alpha untuk Tes Belah Dua………32

Rumus 14 Kuder-Richardson 20………...33

Rumus 15 Kuder-Richardson 21………...34

Rumus 16 Kuder-Richardson 21 dengan rata-rata………....34

Rumus 17 Kristof untuk Belah Tiga……….35

Rumus 18 Flanagan………...35

Rumus 19 Standar Eror Pengukuran……….37


(16)

LAMPIRAN I Data Penelitian

A. Tabulasi Respon Subjek terhadap Subtes RA pada IST….………..…80

B. Z-Skor Subjek pada 9 Subtes IST ………81

LAMPIRAN II Analisis Parameter Aitem dengan Program Iteman A. Menyimpan Data dalam Bentuk Notepad/Fixed ASCII….………….82

B. Membuat Syntax (Control Tile)….………....83

C. Membuka Lembar Kerja Iteman………...………84

D. Memasukkan Data………....85

D. Membaca Hasil Analisis Iteman……….…………..86

E. Hasil Analisis p, d dan Reliabilitas Subtes RA dengan Iteman……....88

LAMPIRAN III Hasil Analisis Korelasi Antar Subtes pada IST dengan Bantuan Program SPSS Versi 16 A. Hasil Korelasi Antar Subtes pada IST...………89


(17)

ABSTRAK

Intelligenz Struktur Test (IST) merupakan salah satu tes inteligensi yang sering digunakan untuk seleksi karyawan dalam jumlah besar oleh P3M Fakultas Psikologi USU. IST yang digunakan adalah IST adaptasi UNPAD tahun 1970-an yang belum pernah dievaluasi secara psikometri oleh P3M Fakultas Psikologi USU. Usia IST yang tidak mudah dan rendahnya pengawasan terhadap kerahasiaan tes mengakibatkan IST tidak reliabel dan valid lagi dalam mengukur kemampuan inteligensi individu. Padahal, seperangkat tes yang berkualitas baik secara psikometri merupakan salah satu syarat mutlak yang harus dipenuhi agar proses pengukuran serta penggunaan hasil pengukuran dapat dipercaya. Oleh karena itu, diperlukan evaluasi terhadap IST, khususnya subtes RA.

Tujuan dari penelitian ini adalah untuk melihat apakah subtes RA masih mampu mengungkap fungsi ukurnya sesuai dengan tujuan subtes RA disusun melalui analisis karakteristik psikometri mencakup analisis indeks kesukaran aitem, indeks diskriminasi aitem, reliabilitas, serta validitas konstrak subtes RA tersebut.

Metode pengumpulan data yang digunakan pada penelitian ini adalah metode dokumentasi, yaitu dengan menggunakan data yang didokumentasikan oleh P3M Fakultas Psikologi USU. Data tersebut berupa respon subjek terhadap subtes RA pada lembar jawaban IST yang diperoleh dari 2011 subjek. Hasil penelitian secara keseluruhan, dengan menggunakan pendekatan teori tes klasik dan berdasarkan tujuan IST, khususnya subtes RA sebagai salah satu tes inteligensi ditemukan bahwa dari total 20 aitem pada subtes RA, 16 aitem yang dianggap baik berdasarkan indeks diskriminasinya. Berdasarkan koefisien reliabilitasnya dan nilai koefisien reliabilitas yang baik untuk tes inteligensi menurut Murphy & Davidshofer (2003) adalah ≥ 0,90, subtes RA dianggap kurang reliabel dalam mengukur fungsi ukurnya karena hanya memiliki koefisien reliabilitas sebesar 0,851. Selain itu, berdasarkan analisis validitas konstraknya, subtes RA tidak lagi berfungsi sebagaimana tujuan awal subtes ini di susun. Pada akhirnya penelitian ini menggambarkan bahwa perlunya peninjauan ulang terhadap aitem-aitem subtes RA sebelum digunakan sebagai tes inteligensi, khususnya pada individu dengan latar belakang pendidikan SMA, D3, dan S1.

Kata Kunci : karakteristik psikometri, teori tes klasik, IST, subtes RA

1

Mahasiswa Fakultas Psikologi Universitas Sumatera Utara

2

Dosen Departemen Umum & Eksperimen Fakultas Psikologi Universitas Sumatera Utara


(18)

ABSTRACT

Intelligenz Struktur Test (IST) is one of the intelligence tests that are often used for selection a large number of employees and conducted by P3M Psychology Faculty of USU. The IST is adopted from UNPAD in the 1970s that has never been evaluated psychometrically by P3M Psychology Faculty of USU. The longterm using of IST and low control over the confidentiality of test result is not reliable and valid in measuring individual intelligence. In fact, the tests that has good quality psychometrically is one of necessary condition that must be met for measurement and using of trusted measurement results. Therefore, it is necessary to evaluate the IST, especially the RA subtest.

The aim of this study is to see if RA subtest is still able to reveal the measuring function in accordance with the objectives of RA subtest that is created by analysis of psychometric characteristics includes the analysis of difficulty item index, discrimination item index, reliability, and validity construct of the the RA subtest.

The method of data collection that is used in this study is a documentation method, by using the data documented by the P3M Psychology Faculty of USU as 2011 answer sheets of IST subject. With using classical test theory (CTT) and based on the purpose of IST as a test selection of large number of employees , the result of this study showed the total of 20 items on RA subtest, only 16 items are considered as good item. From the coefficient of reliability and good reliability coefficients for tests of intelligence according to Murphy & Davidshofer (2003), RA subtest was considered less reliable in measuring the measurement function because it only has a reliability coefficient of 0.851. In addition, Based on validity, RA subtest is no longer serve as the initial aim of this subtest designed. At last, this study showed that it is necessary to review of the items of RA subtest before being used as intelligence tests to an individual, especially in individuals with educational backgrounds from high school, D3, and S1.

Keywords : psychometric characteristics, classical test theory, IST, subtestRA

1

Student of Psychology Faculty , Sumatera Utara University

2

Lecturer Department of General and Experimental of Psychology Faculty, Sumatera Utara University


(19)

A.Latar Belakang Masalah

Pendidikan Ilmu Psikologi mulai diselenggarakan di Indonesia pada tahun 1953. Sejak itu, ilmu psikologi berkembang dan banyak diselenggarakan di perguruan tinggi negeri maupun swasta. Selain itu, perkembangan ilmu psikologi juga ditandai oleh banyaknya penemuan ilmiah tentang pengaruh aspek psikologis dalam kehidupan individu sehingga ilmu psikologi semakin dikenal umum dan diterima oleh masyarakat Indonesia.

Masyarakat lebih mengenal Psikologi dari jasa dan praktik yang disediakan oleh tenaga profesional psikologi atau Psikolog. Jasa dan praktik Psikologi ini diberikan untuk menolong individu dalam bentuk asesmen, diagnosis, prognosis, konseling dan psikoterapi. Namun, bentuk dari jasa dan praktik Psikologi yang lebih dikenal dan berkembang di masyarakat adalah asesmen dalam bentuk pengukuran aspek-aspek psikologis pada diri individu. Menurut Azwar (2007), alat yang digunakan untuk mengungkap aspek-aspek psikologis dalam diri individu disebut dengan tes psikologi.

Tes Psikologi merupakan suatu alat ukur yang objektif dan terstandar terhadap suatu sampel prilaku (Anastasi & Urbina, 2006). Menurut Sukardi (1997), tes psikologi berfungsi untuk seleksi, klasifikasi, deskripsi, mengevaluasi suatu treatment, dan menguji suatu hipotesis yang berhubungan dengan aspek-aspek psikologis. Namun, fungsi yang lebih umum dan berkembang saat ini


(20)

adalah untuk seleksi, khususnya seleksi karyawan. Fungsi ini digunakan oleh bidang industri dan organisasi untuk memutuskan individu yang tepat untuk suatu pekerjaan tertentu.

Aneka ragam tes psikologi telah dirancang dengan fungsi dan tujuan yang berbeda yang umum digunakan dalam seleksi, diantaranya tes intelegensi, bakat, minat dan kepribadian. Dari berbagai jenis tes psikologi ini, salah satu yang cukup penting dalam mengukur dan memprediksi tingkah laku seseorang adalah tes inteligensi. Menurut Anastasi & Urbina (2006) tes inteligensi dapat digunakan untuk mengukur kemampuan kognisi atau disebut juga inteligensi pada individu yang telihat dari perilaku-perilaku yang ditunjukkan.

Intelligenz Struktur Test (disingkat IST) merupakan tes inteligensi yang umum digunakan di Indonesia. Tes inteligensi ini dikembangkan oleh Rodolf Amthauer pada tahun 1953. IST diciptakan berdasarkan pandangan bahwa inteligensi merupakan keseluruhan struktur dari kemampuan jiwa dan rohani yang akan tampak jelas dalam hasil tes. Tes ini terdiri dari sembilan subtes yaitu

Satzergaenzung (SE), Wortauswahl (WA), Analogien (AN), Gemeinsamkeiten

(GE), Merkaufgaben (ME), Rechenaufgaben (RA), Zahlenreinhen (ZR),

Figurenauswahl (FA), dan Wuerfelaufgaben (WU). Setiap subtes ini mengukur aspek-aspek yang berbeda dari inteligensi dan dapat digunakan secara keseluruhan atau satu subtes saja. Oleh karena itu, tes ini dapat menggambarkan pola kerja tertentu, sehingga akan cocok digunakan untuk memprediksi tuntutan profesi atau pekerjaan tertentu ( Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009).


(21)

Tes inteligensi yang dikembangkan oleh Amthauer ini digunakan di Indonesia setelah di adaptasi oleh Fakultas Psikologi Universitas Padjajaran Bandung (UNPAD) dari alat tes aslinya. Semenjak diadaptasi, IST sering digunakan oleh biro-biro psikologi di Indonesia salah satunya adalah Unit Pusat Penelitian dan Pengabdian pada Masyarakat Fakultas Psikologi Universitas Sumatra Utara (P3M Fakultas Psikologi USU). IST yang digunakan oleh P3M Fakultas Psikologi USU ini merupakan IST-70 adaptasi tahun 1970-an di Universitas Padjajaran Bandung. Berikut penuturan seorang staf P3M, Novi:

“IST yang kita pakai disini adalah IST adaptasi UNPAD tahun 1970-an. Tes ini lebih sering digunakan untuk tes yang diambil secara kelompok dengan peserta lebih dari 100 orang. Biasanya untuk seleksi pegawai. Sejak saya disini, IST telah digunakan dalam proses seleksi penerimaan karyawan beberapa perusahaan besar” Novi (komunikasi personal, 24 juli dan 06 Oktober 2010).

Berdasarkan pernyataan tersebut dapat diketahui bahwa IST yang digunakan oleh P3M Fakultas Psikologi USU telah berusia lebih dari tiga puluh tahun dan masih sering digunakan oleh P3M Fakultas Psikologi USU, terutama dalam proses seleksi karyawan.

Proses seleksi karyawan merupakan proses pencarian individu yang tepat untuk suatu pekerjaan. Hasil tes atau skor IST menjadi salah satu landasan pengambilan keputusan apakah individu diterima atau tidak. Kelayakan keputusan yang diambil berdasarkan interpretasi skor tes sangatlah ditentukan oleh kualitas pengukuran dan ketepatan interpretasinya (Azwar, 2007). Selain itu, harus disadari bahwa subjek tes adalah manusia. Oleh karena itu, persoalan tes dan pengukuran bukan sekedar masalah keberhasilan mendeskripsikan atribut dalam diri manusia ke dalam bentuk angka dan label interpretasinya. Masalah yang lebih


(22)

penting adalah akibat yang dapat ditimbulkan oleh hasil tes. Akibat tersebut bahkan dapat menjangkau bukan saja subjek pengukuran itu saja melainkan juga orang-orang lain yang ikut berkepentingan dalam dirinya.

Azwar (2007) menyatakan bahwa sebagai alat ukur, suatu tes dapat dikatakan berhasil menjalankan fungsi ukurnya apabila alat tersebut mampu memberikan hasil ukur yang cermat dan akurat. Artinya, suatu alat tes berkualitas baik dalam proses seleksi akan menentukan seberapa baik proses seleksi itu membedakan antara peserta tes yang mempunyai sedikit kemampuan dan yang mempunyai lebih banyak kemampuan, sehingga akan menentukan seberapa baik dan tepat individu yang terpilih dari proses seleksi tersebut sesuai dengan yang diharapkan. Selain itu, suatu alat tes yang baik terdiri dari aitem-aitem yang dirancang sedemikian rupa dalam bentuk pernyataan mengenai dimensi apa yang hendak diukur atau diungkap dari aitem tersebut (Azwar 2007). Jadi, suatu tes yang berkualitas ditentukan oleh kualitas aitem-aitem didalamnya sehingga syarat-syarat validitas, reliabilitas, dan objektivitas pada penggunaan tes sebagai alat ukur terpenuhi. Cara yang dapat dilakukan untuk mengetahui suatu alat ukur memiliki kualitas yang baik atau tidak dapat diketahui melalui uji analisis karakteristik psikometri pada alat ukur tersebut.

Analisis karakteristik psikometri pada IST pernah dilakukan oleh Santosa dkk. (dalam Astya, 2008) pada tahun 1997 di Universitas Atma Jaya, Jakarta. Penelitian tersebut dilakukan untuk uji validitas prediktif sehubungan dengan pemakaian IST sebagai tes seleksi masuk mahasiswa baru Universitas Atma Jaya pada tahun akademik 1997/1998 untuk Fakultas Hukum, Fakultas Keguruan dan


(23)

Ilmu Pendidikan, dan Fakultas Psikologi. Hasilnya menunjukkan bahwa IST kurang baik dalam memprediksi keberhasilan prestasi mahasiswa pada semester pertama. Hanya beberapa subtes saja yang berkorelasi signifikan (p≤0.05) dengan prestasi mahasiswa dan korelasinya masih dalam taraf yang kecil. Subtes-subtes tersebut adalah SE dengan r = 0,219; AN dengan r = 0,192; ME dengan r = 0,210; RA dengan r =0,251; ZR dengan r = 0,176; GE dengan r = 0,152.

Sejak dilakukan uji validitas prediktif ini, IST tidak lagi digunakan untuk alat seleksi di Universitas Atma Jaya karena dianggap tidak dapat meramalkan prestasi mahasiswa (Astya, 2008). Pada tahun 2001, Fakultas Psikologi Universitas Airlangga melakukan uji validitas dan reliabilitas pada aitem IST dengan subjek 200 siswa SMA, hasilnya menunjukkan bahwa dari 176 aitem terdapat 131 aitem yang dinyatakan valid dan 45 aitem yang dinyatakan gugur dan dari sembilan subtes, satu subtes yakni ZR (dengan jumlah aitem 20) dinyatakan semua aitemnya valid. Sedangkan untuk reliabilitas dari sembilan subtes tersebut semuanya dinyatakan reliabel dengan besar koefisien sebesar 0,463-0,821 pada taraf signifikansi 0,01. Namun hasil ini tidak bisa digeralisasi lebih luas mengingat jumlah dan karakteristik subjek yang terbatas (Hamidah, 2001).

Santosa dkk. (dalam Widianti, 2008) juga menyatakan bahwa sebuah tes yang telah dipakai dalam jangka waktu lama seperti IST, memang memerlukan pengujian ulang untuk melihat sejauhmana tes tersebut masih dapat digunakan sebagai alat ukur yang handal. Handayani (dalam Widianti, 2008) juga menyatakan bahwa issue lainnya yang berkembang menurut Himpunan Sarjana Psikologi dan Psikolog Indonesia (HIMPSI), IST tidak lagi digunakan di


(24)

kota-kota besar seperti Jakarta karena IST diduga tidak valid untuk mengukur inteligensi. Kondisi ini dilatarbelakangi oleh frekuensi pemakaian yang terlalu tinggi dan kerahasiaan yang sulit dikontrol. Hasil wawancara dengan dosen Fakultas Psikologi USU yang juga ketua P3M Fakultas Psikologi diketahui bahwa IST juga telah bocor di kota Medan, tidak jarang individu memiliki lembar IST dan mendapatkan skor yang mendekati sempurna walaupun individu tersebut tidak mau menjawab semua dengan benar karena takut dicurigai oleh tester atau individu yang memberikan tes. Oleh karena itu, penggunaan IST di P3M Fakultas Psikologi USU umumnya atas permintaan individu atau perusahaan yang bersangkutan. Sebelumnya, pihak P3M akan menjelaskan kelemahan dan kelebihan tes tersebut (Komunikasi Personal, Ari Widiyanta, 26 November 2010).

Validitas dan reliabilitas yang masih dipertanyakan serta kerahasian yang sulit dikontrol pada IST seharusnya membuat para pengguna tes ini mempertanyakan kelayakan tes dalam mengukur inteligensi dan melakukan evaluasi terhadap alat tes tersebut. Namun kenyataannya, IST masih saja digunakan di Indonesia, khususnya oleh P3M Fakultas Psikologi USU tanpa pernah melakukan evaluasi atau uji analisis karakteristik psikometri terhadap IST tersebut. Sukardi (1997) menyatakan bahwa syarat tes yang baik memiliki kriteria pokok sebagai berikut: tes yang terstandar atau baku dalam hal administrasi, penskoran dan norma yang digunakan untuk membantu interpretasi skor; objektif; valid; dan reliabel. Maka dapat disimpulkan bahwa suatu tes yang tidak memiliki kriteria ini, dapat dikatakan bahwa tes tersebut tidak objektif dan tidak layak untuk digunakan. Oleh karena itu, penelitian ini berusaha melihat dan melakukan


(25)

proses analisis karakteristik psikometri terhadap IST sebagai salah satu tes inteligensi yang sering digunakan oleh P3M Fakultas Psikologi USU.

Pada penelitian ini, pengujian secara psikometri hanya akan dilakukan pada satu subtes, yaitu subtes Rechenaufgaben (RA). Subtes RA terdiri dari 20 soal mulai dari nomor 77 sampai dengan 96. Subtes digunakan untuk mengetahui kemampuan berpikir praktis dalam berhitung, berpikir induktif, reasoning, dan kemampuan mengambil kesimpulan (Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009).

Aitem-aitem dalam subtes RA disajikan dalam bentuk kalimat cerita. Kalimat-kalimat tersebut terdiri dari 14 kata sampai dengan 38 kata. Seperti aitem terakhir nomor 96, aitem ini dinyatakan dengan kalimat cerita yang paling panjang sekitar 38 kata diantara aitem yang lainnya. Hal ini menunjukkan bahwa aitem tersebut tidak hanya mengukur kemampuan berpikir praktis dalam berhitung, tetapi juga mengukur kemampuan pemahaman bahasa individu yang dikenai tes. Selain itu angka dan bilangan yang digunakan dalam subtes ini tidak sesuai dengan perkembangan Indonesia saat ini. Seperti pada aitem no 77, 81, 84, 89, 91 menggunakan bilangan puluhan rupiah bahkan satuan rupiah. Sekarang ini, nilai uang dalam bentuk satuan rupiah atau puluhan rupiah tidak lagi dikenal dan digunakan dalam transaksi jual beli di Indonesia. Nominal uang yang paling kecil yang masih berlaku adalah Rp. 100,-.

Hasil penelitian Fakultas Psikologi Universitas Atma Jaya, Jakarta tahun 2008 dengan subjek siswa SMA, menunjukkan bahwa subtes RA mengukur konstruk inductive reasoning dan valid memprediksi keberhasilan siswa jurusan


(26)

IPS dan IPA, namun tidak berfungsi sebagai tes differensial (Engelen, 2008). Berdasarkan hasil tersebut dapat dikatakan bahwa subtes ini tidak dapat membedakan individu yang memiliki kemampuan berpikir praktis dalam berhitung, berpikir induktif, reasoning, dan kemampuan mengambil kesimpulan dengan individu yang tidak memiliki kemampuan tersebut.

Secara umum, analisis yang akan dilakukan dalam penelitian ini mencakup analisis karakteristik psikometri berupa analisis indeks diskriminasi dan kesukaran aitem, reliabilitas, serta analisis validitas subtes RA. Analisis reliabilitas dilakukan sebagai salah satu pendekatan untuk mengestimasi skor murni individu. Melalui koefisien reliabilitas dapat diestimasi letak skor murni individu dalam suatu wilayah interval tertentu. Semakin tinggi koefisien reliabilitas mengindikasikan semakin kecil pula eror yang terjadi dalam konteks pengukuran (Suryabrata, 2005). Selanjutnya uji validitas, Azwar (2007) mengartikan validitas sebagai sejauhmana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Pada penelitian ini validitas yang akan diuji adalah validitas konstrak yang bertujuan untuk meneliti ketepatan subtes RA dalam mengukur kemampuan berpikir praktis dalam berhitung, berpikir induktif, reasoning, dan kemampuan mengambil kesimpulan dengan menggunakan metode multitrait-multimethod

yang meliputi validitas diskriminan dan konvergen. Koefisien validitas konvergen dan diskriminan dilihat dari korelasi antara subtes RA dengan 8 subtes lainnya pada IST dalam bentuk matrik multitrait-multimethod. Korelasi yang tinggi menunjukkan bahwa subtes-subtes tersebut mengukur hal yang sama atau


(27)

konvergen. Sebaliknya, korelasi yang rendah menunjukkan bahwa subtes-subtes tersebut mengukur hal yang berbeda.

B.Identifikasi Masalah

Berdasarkan Latar Belakang Masalah yang telah diuraikan, maka dapat diidentifikasi beberapa masalah yang berhubungan dengan IST, khususnya subtes RA, yaitu:

1. IST masih sering digunakan sebagai tes inteligensi oleh P3M Fakultas Psikologi USU, meskipun IST yang digunakan oleh P3M Fakultas Psikologi USU tersebut merupakan IST adaptasi Fakultas Psikologi UNPAD, Bandung tahun 1970-an dan belum pernah dievaluasi secara psikometri oleh P3M Fakultas psikologi USU.

2. Hasil beberapa penelitian menyatakan bahwa sekarang ini IST memiliki validitas prediktif kurang baik, 45 aitem IST dinyatakan gugur atau tidak valid, serta tidak lagi digunakan di kota-kota besar seperti di Jakarta karena diduga tidak valid untuk mengukur inteligensi akibat frekuensi pemakaian yang terlalu tinggi dan kerahasiaan yang sulit dikontrol.

3. IST juga telah bocor di Kota Medan sehingga tidak jarang individu memiliki lembar IST dan mendapatkan skor IST yang mendekati sempurna.

4. Hasil penelitian tentang subtes RA diketahui bahwa subtes RA mengukur konstruk inductive reasoning dan tidak berfungsi sebagai tes differensial. 5. Aitem pada subtes RA berbentuk kalimat cerita yang terdiri dari 14 sampai 38


(28)

ukurnya tetapi juga mengungkap kemampuan bahasa yang dimiliki oleh individu yang dikenai tes.

6. Penggunaan nilai mata uang yang berlaku di Indonesia pada tahun 1970-an membuat aitem dalam subtes ini tidak sesuai lagi dengan nilai mata uang yang berlaku dalam transaksi jual beli di Indonesia sekarang ini.

C. Rumusan Masalah

Permasalahan dalam penelitian ini dirumuskan dalam bentuk pertanyaan sebagai berikut:

1. Seberapa baikkah indeks kesukaran aitem subtes RA pada IST? 2. Seberapa baikkah indeks diskriminasi aitem subtes RA pada IST?

3. Apakah subtes RA pada IST masih dapat dipercaya atau memiliki nilai reliabilitas yang baik?

4. Bagaimanakah validitas konstrak subtes RA pada IST yang dilihat dari koefisien validitas konvergen dan koefisien validitas diskriminan?

5. Bagaimanakah kualitas subtes RA pada IST berdasarkan hasil analisis karakteristik psikometri?

D. Tujuan Penelitian

Penelitian ini bertujuan untuk melihat apakah IST masih berfungsi sesuai dengan tujuan IST disusun, khususnya pada subtes RA berdasarkan karakteristik psikometri yang dimiliki.


(29)

E. Manfaat Penelitian

Penelitian ini diharapkan dapat memberikan manfaat teoritis maupun praktis, sebagai berikut:

1. Manfaat Teoritis

Penelitian ini diharapkan dapat menambah manfaat keilmuan dalam bidang psikologi mengenai karakteristik psikometri subtes RA pada IST sehingga dapat memberikan informasi apakah subtes RA pada IST masih berfungsi sesuai dengan tujuan subtes tersebut disusun.

2. Manfaat Praktis

a) Penelitian ini diharapkan menjadi masukan dan landasan bagi akademisi psikometri untuk merevisi IST, khususnya subtes RA.

b) Penelitian ini diharapkan dapat menjadi bahan pertimbangan bagi para praktisi untuk menggunakan IST, khususnya subtes RA sebagai alat pengukur inteligensi dalam pengambilan keputusan.


(30)

BAB II

TINJAUAN PUSTAKA

Pada dasarnya ilmu pengukuran memiliki dua pendekatan, yaitu pendekatan classical test theory (CTT) dan pendekatan teori modern. Pendekatan CTT adalah metode pertama yang dikembangkan untuk pengukuran. Teori-teori CTT mendominasi pengembangan rumus reliabilitas dan validitas yang dikenal dewasa ini (Azwar, 2007 dan Suryabrata, 2005). Namun CTT memiliki beberapa keterbatasan, yaitu tergantung pada kelompok sampel yang digunakan, asumsi kesetaraan eror pengukuran pada semua subjek yang dikenai tes sulit untuk diterima dan tidak ada pernyataan lain yang dapat memperkuat asumsi ini, khususnya pada tes yang sulit, serta definisi tes paralel yang dimaksud oleh CTT sangat sulit untuk dipenuhi dalam praktek (Azwar, 2005).

Pendekatan teori modern didasarkan pada sifat-sifat atau kemampuan yang laten, yang mendasari performansi atau respon subjek terhadap aitem tertentu sehingga disebut dengan Teori Sifat Laten (Latent Trait Theory) atau yang lebih populer dengan sebutan Teori Respons Aitem (Item Response Theory yang selanjutnya disingkat IRT (Suryabrata, 2005). Pendekatan ini bertujuan untuk mengatasi kelemahan-kelemahan CTT. IRT dikembangkan atas dasar dua postulat. Pertama, performansi seorang subjek pada suatu aitem dapat diprediksi dari seperangkat faktor yang disebut traits, latent traits, atau kemampuan. Kedua, hubungan antara performansi subjek pada suatu aitem dan kemampuan yang mendasari performansi tersebut dapat digambarkan oleh suatu fungsi yang


(31)

meningkat secara monotonik yang disebut item characteristic function atau item characteristic curve (ICC). ICC akan menunjukkan bahwa subjek yang memiliki kemampuan yang tinggi akan memiliki peluang yang lebih besar untuk menjawab aitem dengan benar. Artinya katakteristik-karakteristik aitem tidak lagi tergantung pada kelompok subjek. Ini menjadi keuntungan menggunakan IRT yang tidak dapat dijelaskan dengan CTT (Azwar, 2005). Model-model IRT memiliki asumsi-asumsi pendukung walaupun tidak dapat diukur secara langsung, namun dapat disimpulkan dan dinilai dari kesesuaian model pada perangkat data tes yang akan dianalisis. Asumsi yang paling umum adalah unidimensionalitas, yaitu hanya satu kemampuan yang diukur oleh aitem-aitem dalam setiap tes. Asumsi berikutnya adalah independensi lokal, yaitu apabila kemampuan-kemampuan yang mempengaruhi peformansi dijadikan konstan maka respon subjek terhadap pasangan aitem manapun juga akan independen secara statistik satu sama lain. Artinya kemampuan subjek pada suatu aitem tidak dipengaruhi oleh faktor-faktor lainnya dan tidak berhubungan dengan kemampuan subjek pada aitem lainnya (Azwar, 2005). Keuntungan lainya dalam menggunakan IRT adalah pendekatan ini sangat mudah diadaptasikan untuk tes yang di administarasi dengan komputer (Kaplan & Saccuzo, 2005). Keterbatasan dari pendekatan ini adalah proses yang cukup rumit dan sulit untuk dilakukan karena analisis dilakukan per aitem dan subjek.

Pada penelitian ini, pendekatan yang akan digunakan dalam proses analisis adalah CTT dengan pertimbangan bahwa pendekatan ini yang dipelajari oleh peneliti selama perkuliahan, CTT mendasari perkembangan rumus reliabilitas dan


(32)

validitas, serta pendekatan ini lebih mudah digunakan karena analisis dilakukan pada kelompok subjek bukan per subjek.

A. Classical Test Theory (CTT)

1. Pengertian CTT

Pendekatan CTT adalah metode pertama yang telah dikembangkan sejak dahulu dan tetap digunakan dewasa ini dalam berbagai bidang kehidupan sehingga pendekatan ini disebut dengan CTT atau teori tes klasik. CTT terbentuk dan berkembang perlahan-lahan melalui unsur-unsur yang akhirnya secara akumulatif menjadi bangunan teori yang utuh. Model pendekatan ini juga disebut model skor murni (true score model). Inti CTT berupa asumsi-asumsi yang dirumuskan secara sistematis (Suryabrata, 2005)

Asumsi-asumsi CTT pada dasarnya merupakan hubungan matematis dari skor tampak yang disimbolkan dengan huruf X, skor murni yang dilambangkan dengan huruf T, dan komponen eror pengukuran yang diberi simbol huruf E. X merupakan nilai performansi individu yang diungkap oleh suatu pengukuran yang dinyatakan dalam bentuk angka yang merupakan nilai total dari jawaban subjek terhadap aitem atau pernyataan dalam tes tersebut. T menjelaskan performansi individu sesungguhnya yang tidak mungkin dapat diungkap secara langsung oleh tes. E menunjukkan besarnya eror individu dalam setiap tes yang angkanya juga tidak dapat diketahui dengan benar (Azwar, 2005).


(33)

2. Asumsi-Asumsi dalam CTT

Pendekatan CTT terdiri dari asumsi-asumsi yang berkaitan dengan skor tampak, skor murni dan komponen eror pengukuran. Allen & Yen (dalam Azwar, 2005) menguraikan hubungan antara eror pengukuran dan skor murni dalam asumsi-asumsi sebagai berikut:

Asumsi 1: X = T + E (1)

Asumsi ini didasarkan pada model Spearman yang menyatakan bahwa setiap skor tes menggambarkan gabungan dari dua komponen yaitu skor murni dan komponen eror (Crocker & Algina, 2005). X merupakan jumlah T dan E, sehingga besar X akan tergantung oleh besarnya E pengukuran, sedangkan besarnya T individu pada setiap pengukuran yang sama diasumsikan selalu tetap. Jadi dapat disimpulkan bahwa skor yang diperoleh dari suatu pengukuran umumnya tidak menunjukkan keadaan sebenarnya (Suryabrata, 2005).

Asumsi 2: ε(X) = T (2)

Asumsi ini menyatakan bahwa T sama dengan nilai harapan dari X-nya yang dilambangkan dengan ε(X). Jadi, T merupakan harga rata-rata dari distribusi teoretik X apabila orang yang sama dikenai tes yang sama berulangkali dengan asumsi pengulangan tes itu dilakukan tidak terbatas banyaknya dan setiap pengulangan tes adalah independen satu sama lain.

Asumsi 3: = 0 (3)

Asumsi ini menyatakan bahwa bagi populasi subjek yang dikenai tes, distribusi E pengukuran dan distribusi T tidak berkorelasi satu sama lain. Implikasinya, skor murni yang tinggi tidak selalu berarti mengandung eror yang


(34)

selalu positif ataupun selalu negative atau mempunyai E lebih tinggi dibanding subjek yang T-nya rendah.

Asumsi 4: = 0 (4)

Asumsi ini menyatakan bahwa dalam eror pada dua tes ( yang dimaksud untuk mengukur hal yang sama) tidak saling berkorelasi. Artinya besarnya E pada suatu tes tidak tergantung pada E tes lainnya. Asumsi ini akan tidak terpenuhi sekiranya skor tampak dipengaruhi kondisi testing, seperti misalnya kelelahan,

practice effect, suasana hati, atau factor-faktor dari lingkungan (Suryabrata, 2005).

Asumsi 5 = 0 (5)

Asumsi ini menyatakan bahwa E pada suatu tes tidak berkorelasi dengan T pada tes lain.

E yang dimaksud dalam CTT adalah penyimpangan X dari skor harapan teoritik yang terjadi secara random atau tidak terjadi secara sistematik. Jika penyimpangan terjadi secara sistematik maka itu tidaklah dianggap sebagai sumber eror.

Selain lima asumsi yang telah dijelaskan, terdapat dua asumsi lagi yang dijelaskan oleh Suryabrata (2005), yaitu:

Asumsi 6

Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama mempunyai skor tampak X dan X’ yang memenuhi asumsi 1 sampai 5, dan jika untuk setiap populasi subjek T = T’ serta varians eror kedua tes tersebut sama, kedua tes tersebut disebut sebagai tes yang paralel.


(35)

Asumsi 7

Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama mempunyai skor tampak X dan X’ yang memenuhi asumsi 1 sampai 5, dan apabila untuk setiap populasi subjek T1 = T2 + C. Dengan C sebagai suatu bilangan konstan, maka kedua tes tersebut dapat disebut sebagai tes yang setara (equivalent test).

Dua tes yang setara dapat memiliki varians eror yang berbeda karena keduanya belum tentu merupakan tes yang paralel, namun dua tes yang paralel tentu memenuhi syarat sebagai tes yang setara (Azwar, 2005).

Asumsi-asumsi CTT secara sekilas terlihat sebagai sesuatu yang hanya bersifat teoritis karena sulit untuk ditemukan dalam kehidupan nyata. Meskipun demikian, CTT masih bertahan sebagai dasar pengembangan dan analisis alat ukur psikologi. Berbagai tes telah disusun berdasarkan CTT di berbagai belah dunia termasuk di Indonesia, seperti Tes Kemampuan Akademik (TPA), Ujian Masuk Perguruan Tinggi Negeri (UMPTN), dan Ujian Akhir Nasional (UAN) (Suryabrata, 2005).

B. Analisis Karakteristik Psikometri

Suatu alat ukur yang telah dikonstruksi pastinya belum dapat dikatakan sebagai alat ukur yang layak pakai apabila analisis terhadap karakteristik psikometri alat ukur tersebut belum dilakukan. Proses analisis terhadap karakteristik psikometri dapat digunakan dalam merancang suatu alat ukur psikologis yang baru atau evaluasi terhadap alat ukur yang telah ada.


(36)

Analisis aitem merupakan suatu prosedur untuk meningkatakan validitas dan reliabilitas suatu alat tes dengan cara memilih aitem-aitem yang baik sesuai dengan tujuan alat tes (Crocker & Algina, 2005). Analisis aitem dapat dilakukan secara kualitatif dan kuantitatif. Analisis aitem secara kualitatif berarti aitem dianalisis berdasarkan bentuk dan isinya yang dapat dilakukan dengan mempertimbangkan validitas isi. Sedangkan analisis secara kuantitatif dilakukan dengan analisis parameter-parameter aitem berupa indeks kesukaran aitem, indeks diskriminasi aitem, analisis reabilitas, dan validitas dari alat ukur tersebut (Anastasi & Urbina, 2006).

Pada penelitian ini analisis aitem hanya dilakukan secara kuantitatif dengan pertimbangan bahwa penelitian ini bertujuan untuk melihat validitas konstrak dan reliabilitas alat ukur mengingat bahwa IST merupakan tes yang diadaptasi yang telah lama digunakan dan tidak bertujuan untuk melihat kualitas aitem secara kualitatif.

1. Indeks Kesukaran Aitem

a. Pengertian Indeks Kesukaran Aitem

Indeks kesukaran aitem adalah proporsi antara individu yang menjawab aitem dengan benar dan total individu yang menjawab aitem tersebut. Indeks kesukaran aitem atau derajat kesukaran aitem disimbolkan oleh huruf p dengan rumus:


(37)

Keterangan:

p = Derajat kesukaran aitem

ni = Banyak peserta tes yang menjawab benar

N = Banyak peserta tes yang menjawab aitem

Indeks kesukaran aitem ditentukan oleh seberapa banyak peserta tes berhasil menjawab aitem dengan benar. Semakin banyak peserta tes menjawab dengan benar, berarti semakin mudah aitem tersebut dan sebaliknya semakin sedikit peserta menjawab dengan benar, maka semakin sulit aitem tersebut (Azwar, 2007).

Crocker & Algina (2005) menjelaskan bahwa untuk aitem yang memiliki skor dikotomi, yaitu 0 jika salah dan 1 jika benar, rata-rata skor aitem tes sama dengan indeks kesukaran aitem sehingga jumlah indeks kesukaran aitem pada suatu tes menjadi sama dengan rata-rata dari skor tes tersebut.

μx = Σp (7)

Keterangan:

μx = rata-rata skor tes

Σp = jumlah indeks kesukaran aitem

Selanjutnya, jika indeks kesukaran aitem dirata-ratakan, maka;

μp = (μx)/k (8)

Keterangan:

μp = rata-rata indeks kesukaran aitem μx = rata-rata skor tes


(38)

Menurut Kumar (2009), angka untuk indeks kesukaran aitem sama dengan nomor aitem dalam tes tersebut. Artinya penyusunan aitem didasarkan pada indeks kesukarannya. Pernyataan ini didukung oleh Murphy & Davidshofer (2003) yang menyarankan untuk menyusun aitem-aitem dalam tes secara sistematis, dengan menempatkan aitem-aitem berdasarkan taraf kesukarannya, mulai dari aitem yang paling mudah hingga yang paling sulit. Oleh karena itu, pola penyusunan aitem-aitem dalam tes sebaiknya dimulai dari aitem dengan harga p yang paling tinggi hingga aitem dengan harga p yang paling rendah. b. Analisis Indeks Kesukaran Aitem

Azwar (2007) menyatakan bahwa taraf kesukaran yang terbaik bergantung pada tujuan dari tes tersebut. Untuk tes prestasi yang bertujuan untuk evaluasi formatif misalnya, tidak jarang diperlukan aitem-aitem dengan taraf kesukaran rendah atau aitem-aitem dengan harga p tinggi. Namun demikian untuk tes yang bertujuan untuk proses seleksi masuk, terlebih dalam tes masuk yang bertujuan untuk proses pendidikan atau pemilihan sebagian kecil calon karyawan, harus diusahakan tes yang memiliki harga p yang rendah atau aitem yang sulit, sehingga individu yang dinyatakan lulus selanjutnya adalah individu yang benar-benar memiliki atribut yang diukur. Lord (dalam Murphy & Davidshofer, 2003) menyatakan bahwa untuk tes seleksi karyawan, p akan dikatakan baik jika nilai p mendekati 0,2. Namun, jika tes dimaksud sebagai perangkat untuk memilih sebagian besar dari calon karyawan yang melamar, maka tes yang baik adalah yang mudah, yaitu rata-rata p-nya tinggi (Suryabrata, 2005).


(39)

Pada dasarnya tes disusun untuk melihat perbedaan individu sehingga jika tidak ada seorang pun yang menjawab pertanyanan dengan benar, dalam artian soal sangat susah (p = 0) bahkan sebaliknya jika soal sangat gampang sehingga semua dapat menjawab pertanyaan dengan benar (p= 1) tentu tujuan alat tes tidak dapat dipenuhi (Murphy & Davidshofer, 2003). Oleh karena itu harga p bergerak mulai dari 0 sampai dengan 1. Apabila dilihat lebih lanjut, harga p yang berada pada titik ekstremnya yaitu titik 0 atau 1 mengindikasikan bahwa aitem tersebut kurang berguna (Azwar, 2007). Allen & Yen (dalam Lababa, 2008), mengkategorikan nilai p sebagai berikut:

Tabel 1. Kategori Nilai p

No. p Kategori

1 p < 0,3 Sulit 2 0.3 <p< 0,7 Sedang 3 p > 0,7 Mudah

Umumnya pada penyusunan alat tes disarankan untuk menggunakan aitem dengan nilai p mendekati 0,5. Ketika tes disusun untuk pengukuran secara umum seperti inteligensi, aitem dengan nilai p mendekati 0,5 akan lebih baik dari pada aitem yang memiliki nilai p ekstrim. Jadi dalam analisis indeks kesukaran aitem, aitem dengan p mendekati 0,5 akan lebih optimal (Murphy & Davidshofer, 2003). Pada penelitian ini, IST merupakan salah satu tes inteligensi dan sering digunakan oleh P3M Fakultas Psikologi USU. Oleh karena itu, berdasarkan Murphy & Davidshofer, 2003, p akan dikatakan baik jika nilai p mendekati 0,5, dan tidak mendekati 0 atau 1. Jika dihubungkan pada kategori Allen & Yen ( dalam Lababa, 2008) maka p yang dianggap baik berada pada kategori sedang atau 0,3<p<0,7.


(40)

2. Indeks Diskriminasi Aitem

a. Pengertian Indeks Diskriminasi Aitem

Indeks diskriminasi aitem merupakan kemampuan aitem dalam membedakan antara individu yang memiliki atribut psikologis yang diukur dengan individu yang tidak memiliki atribut psikologis yang diukur (Azwar, 2007). Murphy dan Davidshofer (2003) mengatakan bahwa aitem yang baik akan mampu membedakan kelompok individu yang mampu dan yang tidak mampu mengerjakan suatu tes dengan baik. Artinya, aitem dengan indeks diskriminasi yang baik harus dapat dijawab dengan benar oleh hampir seluruh kelompok individu yang memiliki atribut, dan dijawab dengan salah oleh hampir sebagian besar kelompok individu yang tidak memiliki atribut.

Menurut Azwar (2007), secara sederhana dapat dikatakan bahwa indeks diskriminasi aitem merupakan suatu harga yang menunjukkan perbedaan proporsi penjawab aitem dengan benar antara kelompok dengan kemampuan tinggi dengan kelompok dengan kemampuan rendah. Indeks diskriminasi aitem disimbolkan oleh d dengan rumus:

d = niT/NT– niR/NR (9)

Keterangan:

niT = Jumlah peserta dari kelompok tinggi yang menjawab aitem dengan benar

NT = Jumlah peserta dari kelompok tinggi

niR = Jumlah peserta dari kelompok rendah yang menjawab item dengan benar


(41)

Karena ni/N= p, maka dapat juga dirumuskan dengan:

d = pT-pR (10)

Keterangan:

pT = Indeks kesukaran item kelompok tinggi

pR = Indeks kesukaran item kelompok rendah

Pada penelitian ini indeks diskriminasi aitem dapat diartikan sebagai kemampuan aitem dalam membedakan individu yang memiliki kemampuan berpikir praktis dalam berhitung, berpikir induktif, reasoning, dan kemampuan mengambil kesimpulan dengan individu yang tidak memiliki kemampuan tersebut.

b. Analisis Indeks Diskriminasi Aitem

Diskriminasi aitem yang maksimal akan dicapai dalam kondisi ketika seluruh subjek kelompok tinggi dapat menjawab aitem dengan benar dan seluruh subjek kelompok rendah tidak mampu untuk menjawabnya, dalam hal ini akan diperoleh harga d = 1. Secara matematik indeks diskriminasi aitem akan berkisar mulai dari -1 sampai dengan +1. Namun demikian hanya harga d yang bernilai positif saja yang memiliki arti dalam analisis aitem (Azwar, 2007).

Harga d yang berada disekitar 0 menunjukkan bahwa aitem yang bersangkutan mempunyai diskriminasi yang rendah sedangkan harga d yang negatif menunjukkan bahwa aitem yang bersangkutan tidak berguna sama sekali bahkan bisa menyesatkan.

Indeks diskriminasi aitem yang ideal adalah yang mendekati angka 1, semakin besar indeks diskriminasi (semakin mendekati 1) berarti aitem tersebut


(42)

mampu membedakan antara individu yang menguasai materi yang diujikan dan mereka yang tidak menguasainya. Semakin kecil diskriminasi aitem (semakin mendekati 0) berarti semakin tidak jelaslah fungsi aitem yang bersangkutan dalam membedakan mana subjek yang menguasai materi yang diujikan dan subjek yang tidak tahu apa-apa (Azwar,2007).

Ebel (dalam Azwar, 2007) terdapat suatu panduan dalam evaluasi indeks diskriminasi aitem, yaitu :

Tabel 2. Evaluasi Indeks Diskriminasi Aitem

d Evaluasi

0,4 atau lebih Bagus sekali

0,3 - 0,39 Lumayan bagus, tidak membutuhkan revisi 0,2 – 0,29 Belum memuaskan, perlu revisi

d < 0,20 Jelek dan harus dibuang

Thorndike (dalam Azwar, 2007) mengatakan bahwa dalam proses seleksi aitem, aitem-aitem yang memiliki nilai diskriminasi aitem di atas 0,50 akan langsung dianggap baik sedangkan aitem-aitem dengan indeks diskriminasi di bawah 0,20 dapat langsung dibuang dan dianggap jelek.

Menurut Murphy dan Davidshofer (2003) ada tiga cara statsistik yang dapat digunakan untuk mengukur indeks diskriminasi aitem, yaitu:

1)Metode kelompok ekstrim

Metode kelompok ekstrim merupakan cara yang mudah untuk mengukur indeks diskriminasi aitem pada kelompok yang besar. Indeks diskriminasi aitem dapat dihitung dengan cara membagi kelompok menjadi dua, Upper group yakni kelompok yang memiliki skor yang tinggi (25-35 % nilai tertinggi didalam kelompok) dan lower group yakni kelompok yang memiliki nilai yang rendah (25-35 % nilai terendah dalam kelompok). Aitem yang memiliki indeks


(43)

diskriminasi aitem yang baik akan dijawab benar oleh upper group dan dijawab salah oleh lower group.

2)Korelasi aitem-total

Korelasi aitem-total memberikan informasi tentang apakah aitem mengukur hal yang sama dengan tes. Korelasi aitem-total untuk aitem yang diskor 1 jika benar dan 0 jika salah sering juga disebut korelasi poin biserial. Artinya, korelasi poin biserial digunakan apabila aitem-aitem dalam tes berbentuk dikotomi dan dengan skor total berupa data kontinyu. Nilai positif menunjukkan bahwa aitem dan tes mengukur hal yang sama, nilai mendekati nol menunjukkan bahwa bahwa aitem tidak memiliki indeks diskriminasi yang baik sehingga upper group menjawab pertayaan dengan salah dan lower group menjawab pertanyaan dengan benar.

3)Korelasi inter-aitem

Korelasi inter-aitem digunakan untuk memahami indeks diskriminasi aitem. Korelasi inter-aitem tidak menjelaskan mengapa beberapa aitem menunjukkan nilai yang tinggi ataupun rendah karena sangat jelas bahwa aitem yang memiliki nilai korelasi aitem total yang positif akan menunjukkan nilai yang positif juga pada kebanyakan aitemnya. Namun korelasi aitem total tidak dapat menjelaskan mengapa korelasi aitem total dapat bernilai negatif. Dan dalam hal ini dapat dijelaskan dengan menggunakan korelasi inter-aitem.

Korelasi inter-aitem dapat membantu dalam memahami mengapa beberapa aitem gagal dalam membedakan subjek yang memiliki kemampuan dengan subjek


(44)

salah dan subjek dari lower group dapat menjawab dengan benar.

Korelasi inter-aitem yang bernilai rendah dapat memiliki dua arti, kemungkinan pertama adalah aitem tidak mengukur hal yang sama dengan tes, sehingga aitem harus dibuang atau dibuat ulang, kemungkinan kedua adalah aitem memang mengukur atribut yang berbeda dengan tes dikarenakan tes memang disusun untuk mengukur dua atribut yang berbeda.

Pada penelitian ini indeks diskriminasi aitem akan dianalisis dengan metode korelasi aitem-total untuk melihat apakah aitem memang mengukur kemampuan berpikir praktis dalam berhitung, berpikir induktif, reasoning, dan kemampuan mengambil kesimpulan yang sama dengan semua aitem pada subtes RA atau aitem juga mengukur atribut yang berbeda pada subtes RA. Rumus korelasi aitem-total yang digunakan adalah korelasi point biserial dengan pertimbangan bahwa aitem pada subtes RA memiliki skor dikotomi, yaitu diskor 1 jika benar dan 0 jika salah, serta skor total subjek berbentuk data kontinyu. Indeks diskriminasi yang dikatakan baik dalam penelitian ini didasari pada evaluasi Ebel (dalam Azwar, 2007), yaitu ≥ 0,4 dengan evaluasi bagus sekali.

3. Reliabilitas Alat Ukur a. Pengertian Reliabilitas

Reliabilitas merupakan penerjemahan dari kata reliability yang menyatakan keterpercayaan, keterandalan, keajegan, kestabilan, konsistensi dan sebagainya, namun pada intinya konsep reliabilitas memiliki makna sejauh mana hasil suatu pengukuran dapat dipercaya (Azwar, 2005). Menurut Anastasi &


(45)

Urbina (2006) reliabilitas suatu tes merujuk pada konsistensi skor yang di peroleh oleh individu yang sama ketika diberikan tes ulang yang sama atau seperangkat tes yang ekivalen dengan tes sebelumnya pada kondisi yang berbeda. Suryabrata (2005) menyatakan bahwa reliabilitas alat ukur menunjukkan sejauh mana hasil pengukuran dengan alat tersebut dapat dipercaya, yang mana hal ini ditunjukkan oleh taraf konsistensi skor yang diperoleh para subjek yang diukur dengan alat yang sama atau minimal setara, dalam kondisi yang berbeda. Oleh sebab itu, konsepsi mengenai reliabilitas berkaitan dengan derajat konsistensi antara dua perangkat skor tes, maka rumus reliabilitas selalu dinyatakan dalam bentuk koefisien korelasi (Azwar, 2005).

b. Bentuk Estimasi Reliabilitas

Reliabilitas alat ukur yang juga menunjukkan eror pengukuran yang tidak dapat ditentukan secara pasti, hanya dapat diestimasi (Suryabrata, 2005). Estimasi reliabilitas dapat dilakukan melalui beberapa metode berdasarkan CTT, yaitu pendekatan tes ulang, pendekatan tes paralel, dan pendekatan konsistensi internal (Azwar, 2005 dan Suryabrata, 2005).

1) Pendekatan tes ulang

Pendekatan tes ulang adalah salah satu dari pendekatan pertama yang pantas dan mudah untuk mengestimasi reliabilitas dari suatu skor tes (Murphy dan Davidshofer, 2003). Pendekatan ini dilakukan dengan cara menyajikan tes dua kali pada suatu kelompok yang sama dalam rentang waktu tertentu, minsalnya dua minggu (Suryabrata, 2005). Asumsinya adalah suatu tes yang reliabel akan menghasilkan skor tampak yang relatif sama apabila diberikan dua kali tes dalam


(46)

waktu yang berbeda pada sekelompok subjek yang sama (Azwar, 2005). Sehingga akan diperoleh dua distribusi skor dari kelompok tersebut. Korelasi antara dua skor pada dua waktu yang berbeda tersebut disebut koefisien reliabilitas (r) (Kumar, 2009).

Pendekatan tes ulang ini dapat dikatakan baik secara teori, namun dalam prakterknya mengandung kelemahan, yaitu kondisi subjek pada tes kedua tidak lagi sama dengan kondisi subjek pada tes pertama baik dari proses belajar, perubahan motivasi, pengalaman, sehingga pendekatan ini lebih baik digunakan bila objek ukur berupa keterampilan, terutama keterampilan fisik (Suryabrata, 2005). Menurut Azwar (2005), pendekatan tes ulang cocok digunakan hanya bagi tes yang mengukur aspek psikologis yang relatif stabil dan tidak mudah berubah.

Rumus yang dapat digunakan untuk menentukan reliabilitas tes ulang adalah Pearson product-moment (Kumar, 2009).

2) Pendekatan tes paralel

Pendekatan reliabilitas bentuk paralel dilakukan dengan memberikan dua bentuk tes yang paralel pada sekelompok subjek, yaitu tes yang memiliki tujuan ukur yang sama dan isi aitem yang setara secara kualitas maupun kuantitas (Azwar, 2005). Pendekatan ini juga disebut sebagai alternate form yang digunakan untuk mengatasi kelemahan pendekatan tes ulang (Kumar, 2009). Asumsinya, dua tes yang paralel akan menghasilkan skor tes yang berkorelasi tinggi satu sama lain dan memiliki koefisien reliabilitas yang tinggi.

Keuntungan pendekatan ini adalah dapat mengurangi efek-efek praktis yang mungkin terjadi pada tes ulang seperti proses belajar dan pengalaman,


(47)

namun kelemahan pendekatan ini adalah sulitnya menyusun perangkat tes yang paralel (Kumar, 2009). Menurut Azwar (2005), dua tes yang paralel hanya ada secara teoritis, tidak benar-benar paralel secara empirik.

Rumus yang dapat digunakan untuk menentukan reliabilitas tes ulang adalah korelasi Pearsonproduct moment (Azwar, 2005).

3) Pendekatan konsistensi internal

Pendekatan ini dilakukan dengan memberikan satu bentuk tes dengan sekali penyajian kepada sekelompok subjek yang bertujuan melihat konsistensi antar aitem atau antar bagian dalam tes tersebut serta menghindari masalah-masalah pada pendekatan tes ulang dan paralel. Seperangkat tes diberikan kepada sekelompok subjek satu kali sehingga diperoleh satu distribusi skor tes dari kelompok subjek tersebut. Untuk itu, prosedur analisis reliabilitasnya diarahkan pada analisis terhadap aitem-aitem atau terhadap kelompok-kelompok aitem dalam tes itu sehingga perlu dilakukan pembelahan tes menjadi beberapa kelompok aitem yang disebut belahan tes. Cara pembelahan tes disesuaikan dengan sifat dan fungsi tes serta jenis skala pengukuran yang digunakan dalam tes tersebut yang kemudian akan menentukan rumusan atau rumus yang dapat digunakan dalam menghitung koefisien reliabilitasnya. Setiap cara pembelahan tes hendaknya mengusahakan agar antar belahan memiliki jumlah aitem sama banyak, indeks kesukaran seimbang, isi sebanding, dan tujuan ukur yang sama atau dalam artian pembelahan aitem memenuhi ciri-ciri paralel (Azwar, 2005).


(48)

(a). Beberapa cara dalam pembelahan tes i. Pembelahan cara random

Membelah tes menjadi dua bagian secara random dapat dilakukan dengan cara undian sederhana guna menentukan aitem-aitem nomor berapa sajakah yang dimasukkan menjadi belahan pertama dan yang mana menjadi belahan kedua. Pembelahan secara random hanya boleh dilakukan bila tes yang akan dibelah berisi aitem-aitem yang homogen baik dari segi konten maupun segi indeks kesukaran aitem, namun jika aitem tersebut heterogen dapat juga menggunakan cara pembelahan ini asalkan aitem tersebut jumlahnya sangat besar (Azwar, 2005).

ii. Pembelahan gasal-genap

Pembelahan gasal-genap dilakukan dengan cara mengelompokkan seluruh aitem yang bernomor urut gasal menjadi belahan pertama dan seluruh aitem yang bernomor urut genap dijadikan satu kelompok belahan kedua. Cara pembelahan ini selain mudah dilakukan juga dapat menghindari kemungkinan terjadinya pengelompokkan aitem-aitem tertentu ke dalam salah satu belahan saja (Azwar, 2005).

iii. Pembelahan matched-random subtes

Pembelahan dengan cara matched-random subtes ditemukan oleh Gulikksen tahun 1950 (dalam Azwar, 2005). Sebelum melakukan pembelahan tes terlebih dahulu harus dihitung indeks kesukaran aitem serta korelasi aitem dengan skor total tes. Dengan cara ini setiap aitem dalam tes diletakkan pada satu posisi


(49)

atau titik tertentu dalam grafik berdasarkan harga indeks kesukaran aitem dan korelasi antara aitem yang bersangkutan dengan skor tes.

Keuntungan menggunakan pendekatan konsistensi internal adalah, dapat menghindari masalah-masalah yang biasanya ditimbulkan oleh pendekatan tes ulang dan pendekatan tes paralel (Azwar, 2005).

(b). Rumus Estimasi Reliabilitas i. Spearman-Brown

Rumus Spearman-Brown digunakan untuk metode split-half atau belah dua (Kumar, 2009 dan Crocker & Algina, 2003). Rumus komputasi Spearman-Brown merupakan rumus koreksi terhadap koefisien korelasi antara dua bagian tes dan dirumuskan sebagai beikut (Azwar, 2005):

S-B = rxx’= (11)

Keterangan:

rxx’ =Koefisien reliabilitas Spearman-Brown r1.2 = Koefisien korelasi antara dua belahan

Rumus ini dapat digunakan jika aitem dikotomi ataupun politomi, pembelahan tes dilakukan dengan cara gasal-genap dan matched-random subtes dan menghasilkan dua bagian yang paralel satu sama lain dan korelasi antara kedua belahan paralel tersebut cukup tinggi.

ii. Koefisien Alpha

Pembelahan tes tidak hanya terbatas pada membagi tes ke dalam dua belahan saja. Cara-cara pembelahan dapat diperluas pemakaiannya untuk membagi tes menjadi beberapa belahan. Bahkan suatu tes yang akan diestimasi


(50)

reliabilitasnya dapat dibelah menjadi bagian-bagian sebanyak jumlah aitemnya sehingga setiap bagian hanya berisi satu aitem saja. Koefisien Alpha akan lebih baik jika pembelahan paralel satu sama lain atau setidaknya dapat memenuhi asumsi τ-equivalent. Rumusan rumus Alpha adalah sebagai berikut (Azwar, 2005):

α = (12)

Keterangan :

= banyaknya belahan tes = varians belahan j; j = 1, 2…k = varians skor tes

Rumus ini dapat digunakan jika aitem dikotomi ataupun politomi, setiap belahan memiliki aitem yang relatif setara, paralel atau setidaknya memenuhi asumsi τ-equivalent. Selain itu, aitem-aitem dalam tes haruslah homogen agar estimasi yang diperoleh dapat mendekati reliabilitas yang sebenarnya.

iii. Koefisien Alpha untuk tes belah dua

Rumus koefisien Alpha dapat digunakan untuk tes yang dibelah dua dan tidak memenuhi asumsi paralel, namun untuk menghindari underestimasi, maka pembelahan tes harus memenuhi asumsi τ-equivalent. Rumus koefisien Alpha untuk estimasi reliabilitas belah dua dirumuskan sebagai berikut (Azwar, 2005):


(51)

Keterangan:

= varians pada belahan 1 = varians pada belahan 2 = varians total skor tes

Rumus ini dapat digunakan jika aitem dikotomi ataupun politomi, setiap belahan memiliki aitem yang relatif setara, paralel atau setidaknya memenuhi asumsi τ-equivalent. Selain itu, aitem-aitem dalam tes haruslah homogen agar estimasi yang diperoleh dapat mendekati reliabilitas yang sebenarnya.

iv. Kuder-Richardson 20 (KR-20)

KR 20 merupakan rata-rata estimasi reliabilitas dari semua cara belah-dua yang mungkin dilakukan. Rumus ini juga disebut sebagai koefisien α-20. Koefisien ini mencerminkan sejauhmana kesetaraan isi aitem-aitem dalam tes. Rumusan rumus KR-20 adalah (Azwar, 2005):

(14)

Keterangan :

= banyaknya aitem dalam tes = varians skor tes

p = proporsi subjek yang mendapat angka 1 pada suatu aitem, yaitu banyaknya subjek yang mendapat angka 1 dibagi oleh banyaknya seluruh subjek yang menjawab aitem tersebut.


(52)

Rumus ini dapat digunakan jika aitem dikotomi, jumlah aitem sedikit dan membelahan tes sebanyak jumlah aitem agar estimasi yang diperoleh dapat mendekati reliabilitas yang sebenarnya.

v. Kuder-Richardson 21

Perhitungan KR-21 menggunakan rata-rata harga p dari keseluruhan aitem, Hal inilah yang membedakan antara 20 dengan 21. Rumusan KR-21 adalah (Azwar, 2005):

(15) Keterangan :

= banyaknya aitem dalam tes = rata-rata p yaitu,

= varians skor tes

Untuk mempermudah komputasi, rumus KR-21 dapat pula dinyatakan sebagai:

(16) Keterangan :

Mx = harga rata-rata means skor tes

Rumus ini dapat digunakan jika aitem dikotomi, jumlah aitem sedikit dan membelahan tes sebanyak jumlah aitem. Indeks kesukaran aitem haruslah setara satu sama lain agar estimasi reliabilitas mendekati nilai yang sesungguhnya. Jadi,


(53)

indeks kesukaran aitem yang sangat bervariasi mengakibatkan estimasi reliabilitas akan lebih rendah dari pada menggunakan KR-20.

vi. Rumus Kristof untuk Belah Tiga

Komputasi koefisien reliabilitas tes yang telah dibelah menjadi tiga bagian ini didasarkan pada rumus estimasi skor murni yang dirumuskan Kristof, yaitu:

(17)

Keterangan:

= kovarians belahan 1 dan belahan 2 = kovarians belahan 1 dan belahan 3 = kovarians belahan 2 dan belahan 3

Rumus ini dapat digunakan jika aitem dikotomi ataupun politomi, membelah tes menjadi 3 bagian, belahan tidak harus sama panjang, jumlah aitem tidak harus sama banyak dengan syarat isi tetap homogen, dan lebih baik digunakan pada subjek dalam jumlah besar (Azwar, 2005).

vii. Flanagan

Flanagan menganggap bahwa varians-varians pada setiap belahan tes merupakan varians eror pengukuran. Maka untuk tes yang dibelah menjadi dua bagian setara reliabilitasnya adalah sebagai berikut:


(54)

Keterangan:

= varians pada belahan 1 = varians pada belahan 2 = varians total skor tes

Pada penelitian ini, estimasi koefisien reliabilitas dilakukan dengan pendekatan konsistensi internal karena data yang akan digunakan hanya dengan satu kali penyajian tes. Rumus estimasi koefisien reliabilitas yang digunakan adalah KR-20 dengan pertimbangan bahwa data penelitian ini berbentuk dikotomi dengan homogenitas indeks kesukaran aitem belum diketahui dan aitem dibelah sebanyak jumlah aitem tersebut.

c. Interpretasi Koefisien Reliabilitas

Konsep reliabilitas dalam CTT dipahami sebagai korelasi yang tinggi antara skor tampak dengan skor murninya sendiri. Allen & Yen (dalam Azwar, 2005) menguraikan enam cara dalam memandang koefisien reliabilitas tes, yaitu:

1) Sejauhmana korelasi antara skor tampak pada dua tes yang paralel yang dilambangkan rxx’

2) Besarnya kuadrat koefisien reliabilitas (rxx’2) dipandang sebagai proporsi

varians suatu tes yang sama dengan variasi skor pada tes lain yang paralel. 3) Koefisien reliabilitas merupakan besarnya perbandingan antara varians

skor murni (st2) dan varians skor tampak (sx2).

4) Koefisien reliabilitas merupakan kuadrat koefisien korelasi antara skor tampak dengan skor murni (rxt2). Nilai rxt2 pasti selalu besar daripada rxx’


(55)

5) rxx’ sama dengan satu dikurang kuadrat koefisien korelasi antara skor tampak dengan eror pengukuran (rxe2).

6) rxx’ sama dengan satu dikurang besarnya perbandingan varians eror dan

varians skor tampak (1- se2/sx2).

Secara teoritik, koefisien reliabilitas berkisar antara 0 sampai 1, namun secara empirik koefisien reliabilitas tidak pernah mencapai 1. Artinya terdapat ketidakkonsistenan skor antara dua tes yang paralel yang disebabkan oleh eror yang mempengaruhi performa subjek dalam mengikuti tes atau perbedaan antara skor tampak dan skor murni subjek (Crocker & Algina, 2005). Menurut Kelly (dalam Crocker & Algina, 2005) ada tiga tipe eror yang berhubungan dengan skor pada suatu tes, yaitu ketidaksesuaian antara skor murni dan skor tampak, ketidaksesuaian antara skor tampak subjek pada satu tes dan skor tampak subjek pada tes yang paralel dengan tes sebelumnya, dan ketidaksesuaian antara skor murni subjek dan estimasi skor murninya. Sehingga penafsiran terhadap koefisien reliabilitas dapat dilakukan melalui penafsiran standar eror pengukuran (SEm), dengan rumusan sebagai berikut:

(19)

Semakin tinggi koefisien reliabilitas suatu tes, maka kemungkinan kesalahan yang terjadi akan semakin kecil. Jadi, tidak ada harga mati dalam koefisien reliabilitas. Tinggi rendahnya koefisien reliabilitas sangat bergantung pada tujuan tes digunakan(Suryabrata, 2005).


(56)

Murphy dan Davidshofer (2003) menjelaskan bahwa makna tinggi atau rendahnya koefisien reliabilitas tergantung pada tipe dari tes yang dikategorikan sebagai berikut:

Tabel 3. Kategori Nilai Estimasi Koefisien Reliabilitas

Nilai estimasi reliabilitas

Bentuk Tes Interpretasi

0.95

Tes inteligensi

Eror pengukuran memiliki efek yang sangat rendah

0.90 Tinggi sampai sedang

0.85 Tes prestasi 0.80

0.75 Kelompok tes pilihan ganda Sedang sampai rendah 0.70 Skala

0.65 Rendah

0.60 Tes proyektif 0.55

0.50 Skor murni dan eror pengukuran

seimbang pada skor tes

Berdasarkan Tabel 3, Murphy & Davidshofer (2003) menyatakan bahwa untuk tes inteligensi nilai estimasi reliabilitas yang dianggap baik jika sama atau besar dari 0.90 dengan interpretasi bahwa nilai reliabilitas tes inteligensi tersebut tinggi sampai sedang. Oleh karena itu, pada penelitian ini nilai koefisien reliabilitas akan dianggap baik jika nilai koefisien reliabilitas ≥ 0.90 dengan pertimbangan bahwa IST merupakan tes inteligensi. Selain itu, IST merupakan salah satu tes inteligensi yang masih sering digunakan oleh P3M Fakultas Psikologi USU.

d. Faktor-faktor yang Mempengaruhi Koefisien Reliabilitas

Crocker & Algina (2005) menjelaskan bahwa ada 3 hal utama yang secara tidak langsung mempengaruhi tinggi rendahnya koefisien reliabilitas suatu instrumen, yaitu:


(57)

1) Homogenitas Kelompok

Koefisien reliabilitas suatu tes akan dipengaruhi oleh variasi antara skor murni dan eror kelompok subjek atau skor tampak kelompok subjek. Jika asumsinya varians eror pada dua tes paralel atau ekivalen tetap dan rxx’ sama

dengan 1-se2/sx2, maka tinggi rendahnya koefisien reliabilitas akan tergantung

pada besar kecilnya varians skor tampak (sx2). Artinya pada kelompok subjek

yang homogen, yaitu yang memiliki varians skor tampak kecil, harga se2/sx2 akan

relatif lebih kecil dibandingkan dengan kelompok subjek yang heterogen. Oleh sebab itu, semakin besar homogenitas kelompok akan semakin rendah nilai koefisien reliabilitas suatu tes dibandingkan dengan kelompok subjek yang heterogen.

2) Batasan Waktu dalam Tes

Tes yang memiliki waktu yang lebih panjang cenderung akan memiliki indeks reliabilitas yang lebih tinggi dibandingkan tes yang memiliki waktu yang lebih pendek, terutama pada tes dengan komposisi aitem yang sama. Hal ini dikarenakan performansi subjek pada tes yang lebih panjang waktunya akan lebih maksimal. Sementara pada tes yang memiliki waktu lebih pendek, performansi subjek akan sangat ditentukan oleh banyak faktor, termasuk kelelahan dan performansi subjek lain yang mengikuti tes tersebut.

3) Panjang Tes

Panjang dari suatu tes sangat bergantung dengan seberapa banyaknya aitem-aitem yang menyusun tes tersebut. Semakin banyak aitem yang memiliki


(58)

kualitas baik dalam suatu tes, maka semakin tinggi pula indeks reliabilitas tes tersebut.

4. Validitas

a. Pengertian Validitas

Pada pendekatan CTT, validitas mempunyai arti sejauhmana ketepatan dan kecermatan suatu alat ukur dalam menjalankan fungsi ukurnya. Suatu tes atau instrumen pengukuran dapat dikatakan memiliki validitas yang tinggi apabila alat tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannnya pengukuran tersebut, sehingga pengertian validitas terlihat berkaitan sangat erat dengan tujuan pengukuran (Azwar, 2005). Sejalan dengan Azwar (2005), Kumar (2009) menyatakan validitas suatu tes mengambarkan ketepatan alat ukur mengukur apa yang akan diukur dengan membandingkan alat ukur tersebut dengan standar atau kriteria yang telah ditetapkan. Artinya suatu tes valid untuk suatu tujuan khusus dan tidak tidak dapat digeneralisasikan untuk tujuan lain. Oleh karena itu, tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Dengan demikian, pernyataan valid terhadap suatu pengukuran harus diikuti oleh keterangan yang menunjuk kepada tujuan awal pengukuran serta kelompok subjek yang mana yang hendak diukur (Azwar, 2005). Selain itu, suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang cermat. Artinya pengukuran tersebut dapat memberikan gambaran


(59)

mengenai perbedaan yang sekecil-kecilnya di antara subjek yang satu dengan yang lain.

b. Jenis-Jenis Validitas

Berdasarkan sifat dan fungsi setiap tes, validitas dikelompokkan dalam tiga kategori, yaitu validitas isi, validitas konstrak, dan validitas berdasarkan kriteria (Azwar, 2005).

1)Validitas Isi

Validitas isi menunjukkan sejauhmana aitem-aitem dalam tes mencakup keseluruhan kawasan isi objek atau ciri atribut yang hendak diukur. Validitas isi ini diestimasi lewat pengujian terhadap isi tes dengan analisis rasional atau lewat

professional judgement. Dengan kata lain validitas isi sangat tergantung pada penilaian subjektif individual dan tidak melibatkan perhitungan statistik. Validitas isi terbagi menjadi dua tipe, yaitu validitas muka dan validitas logik.

2)Validitas Konstrak

Validitas konstrak menunjukkan sejauhmana tes mencakup suatu trait

atau konstrak teoritik yang hendak diukur (Allen & Yen, dalam Azwar, 2005). Kontrak psikologis tidak dapat diobservasi secara langsung. Konstrak ini didefinisikan sebagai hasil dari percobaan atau imajinasi secara ilmiah, suatu ide yang dikembangkan untuk mengkategorikan dan menjelaskan dari tingkah laku yang dapat diamati secara langsung (Crocker & Algina, 2005). Lord & Novick (dalam Crocker & Algina, 2005) menyatakan ada dua cara dalam mendefinisikan konstrak, yaitu dengan mendefinisikan secara operasional dan melakukan korelasi yang spesifik antara konstrak yang diukur dengan konstrak atau variabel lainnya.


(60)

Pengujian validitas konstrak merupakan proses yang berlangsung terus berlanjut sejalan dengan perkembangan konsep mengenai konstrak atau trait yang diukur (Azwar, 2005). Pengujian validitas konstrak umumnya memerlukan teknik analisis statistik yang lebih kompleks, tetapi hasil estimasi validitas konstrak tidak dinyatakan dalam bentuk suatu koefisien validitas. Prosedur pengujian validitas ini berangkat dari hasil komputasi interkorelasional diantara berbagai hasil tes dan kemudian dianalisis lebih lanjut terhadap matriks korelasi yang diperoleh melalui dua pendekatan, yaitu analisis faktor dan multitrait-multimethod (Azwar, 2005). 1) Analisis faktor

Analisis faktor merupakan kumpulan prosedur matematik yang kompleks guna menganalisis hubungan diantara variabel-variabel dan menjelaskan hubungan tersebut dalam bentuk kelompok variabel yang terbatas yang disebut faktor. Pada dasarnya, koefisien korelasi yang tinggi diantara dua tes menunjukkan bahwa kedua tes mengukur suatu faktor yang sama (Azwar, 2005). 2) Analisis multitrait-multimethod

Campbell dan Fiske (dalam Crocker & Algina, 2005) menggambarkan pendekatan ini sebagai ketepatan tes mengukur suatu konstrak dilihat dari keakuratan atau korelasi tes dengan konstrak yang sama secara teoritis dan korelasi tes dengan tes yang mengukur konstrak yang lain. Setiap koefisien korelasi diidentifikasi dengan tiga cara, yaitu:

(a). Koefisien reliabilitas

Korelasi antara dua pengukuran konstrak yang sama dan menggunakan metode yang sama secara ideal akan berkorelasi tinggi.


(61)

(b). Koefisien validitas konvergen

Korelasi antara pengukuran konstrak yang sama tetapi menggunakan metode pengukuran yang berbeda akan menghasilkan korelasi yang tinggi, namun perbedaan metode memiliki kemungkinan untuk tidak berkorelasi secara lebih baik.

(c). Koefisien validitas diskriminan

Korelasi antara pengukuran konstrak yang berbeda menggunkan metode pengukuran yang sama (heterotrait-monomethod coefficient) atau korelasi antara konstrak dan cara pengukuran yang berbeda ( heterotrait-heteromethod coefficints) secara ideal memiliki reliabilitas atau koefisien validitas yang rendah.

3). Validitas Berdasarkan Kriteria

Validitas berdasar kriteria merupakan sejauhmana hasil pengukuran suatu alat tes sama atau mirip dengan hasil pengukuran dengan tes yang lain yang dijadikan sebagai kriteria (Suryabrata, 2005). Dalam validasi tes berdasar kriteria, umumnya tes yang akan diuji validitasnya disebut sebagai prediktor. Prosedur validasi berdasar kriteria menghasilkan dua macam validitas, yaitu:

(a). Validitas prediktif

Estimasi validitas prediktif sangat penting artinya bila tes yang dimaksud berfungsi sebagai prediktor bagi performansi diwaktu yang akan datang (Azwar, 2005).


(1)

Nb: gunakan hurus kecil semua atau kapital semua

Langkah selanjutnya simpan kembali data yang telah dimasukan syntax, misal: RA05.txt (dalam bentuk notepad)

C. Buka Lembar Kerja Iteman

1. Klik Start-Programs-Accessories-Command Prompt, akan muncul lembar seperti:

2. Selanjutnya Ketik cd .. (enter) – cd .. (enter) – cd iteman (enter) – iteman, maka akan muncul:


(2)

D. Memasukkan Data

Contoh:

Enter the name of the input file: RA05.txt <enter>

Enter the name of the output file: RA05.out <enter>

Do you want the scores written to a file? (Y/N) Y <enter>

Enter the name of the score file: SkorRA05.txt <enter>


(3)

E. Membaca Hasil

File hasil analisis dan skor akan tersimpan didalam folder Iteman, Tampilan hasil iteman


(4)

Keterangan:

Prop. Correct = indeks kesukaran aitem,

Biser dan Point Biser. = korelasi Biserial dan Korelasi Point Biserial (indeks diskriminasi aitem),

Alt. = alternative/pilihan jawaban,

Prop. Endorsing = proporsi Jawaban pada setiap option Alpha = koefisien reliabilitas


(5)

F. Ringkasan Hasil Analisis Indeks Kesukaran Aitem, Indeks Diskriminasi Aitem dan Reliabilitas Subtes RA dengan Bantuan Program ITEMAN

Aitem p d

77 0,937 0,233 78 0,727 0,464 79 0,412 0,544 80 0,279 0,571 81 0,658 0,555 82 0,326 0,636 83 0,526 0,491 84 0,336 0,679 85 0,205 0,600 86 0,089 0,465 87 0,261 0,617 88 0,156 0,665 89 0,106 0,610 90 0,145 0,630 91 0,077 0,558 92 0,073 0,561 93 0,017 0,304 94 0,029 0,397 95 0,038 0,405 96 0,012 0,249 Keterangan:

p = Indeks kesukaran aitem d = Indeks diskriminasi aitem Scale Statistics

---


(6)

LAMPIRAN III

HASIL ANALISIS KORELASI ANTAR SUBTES PADA IST DENGAN BANTUAN PROGRAM SPSS VERSI 16

A. Hasil Korelasi Antar Subtes pada IST

Lihat Pada File dalam bentuk Excel dengan nama Lampiran III Korelasi.