Karakteristik Psikometri Subtes Wortauswahl (WA) Pada Intelligenz Struktur Test (IST)

(1)

(2)

LAMPIRAN I

DATA PENELITIAN


(3)

LAMPIRAN II

LAMPIRAN II

ANALISIS PARAMETER AITEM DENGAN PROGRAM ITEMAN

A. Menyimpan Data dalam Bentuk NotePad/Fixed ASCII 1. Notepad

Alur kerja:

1. Klik Start-Programs-Accessories-Notepad 2. Masukan data

3. Save di local disk (C) satu folder dengan program Iteman 2.Fixed ASCII

Fixed ASCII ini penyimpanan data dari lembar kerja SPSS. Alur kerja:

1. Klik Start-Programs-SPSS 2. Masukan data

3. Save as (di local disk C satu folder dengan program Iteman)-Save as type (pilih Fixed ASCII), seperti:


(4)

B. Membuat Syntax (Control Tile)

Setelah data tersimpan dalam bentuk notepad atau Fixed ASCII di lokal disk C (satu folder dengan program Iteman), buka lagi data tersebut, kemudian masukan syntax (control tile) dengan cara:

1. Baris pertama adalah baris pengontrol yang mendeskripsikan data. 2. Baris kedua adalah daftar kunci jawaban setiap aitem.

3. Baris ketiga adalah daftar jumlah option untuk setiap aitem.

4. Baris keempat adalah daftar aitem yang hendak dianalisis (jika aitem yang akan dianalisis diberi tanda Y (yes), jika tidak diikutkan dalam analisis diberi tanda N (no).

5. Baris kelima dan seterusnya adalah data subjek dan pilihan jawaban subjek. Contoh:

020 o n 08 [Jumlah soal, kode omit, kode tidak dijawab, jumlah karakter] 11111111111111111111 [Kunci jawaban dapat ditulis dengan angka atau huruf] 22222222222222222222 [Jumlah pilihan jawaban]


(5)

yyyyyyyyyyyyyyyyyyyy [Aitem yang dianalisis ditulis y, jika tidak ditulis n] S0001 BBDCCECEAACDACCEBEAC

S0002 EEDCCCCCDACDBBCEBDDE S0003 BBDDCCBDDCCAABCABEBC S0004 BBEEBACDDADDBBDDDEEC S0005 BBDNCCCADCEEBCCCDNND ………..dst sampai S2011………

Nb: gunakan hurus kecil semua atau kapital semua

Langkah selanjutnya simpan kembali data yang telah dimasukan syntax, misal: WAder.dat (dalam bentuk notepad)

C. Membuka Lembar Kerja ITEMAN Alur kerja:

1. Klik Start-Programs-Accessories-Command Prompt, akan muncul lembar seperti:


(6)

2. Ketik cd .. (enter) – cd .. (enter) – cd iteman (enter) – iteman, maka akan muncul:

MicroCAT (tm) Testing System

Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation Beta-Test Version--Univ. of Pittsburgh

Item and Test Analysis Program -- ITEMAN (tm) Version 3.00 Enter the name of the input file:

3. Kemudian isilah pertanyaan-pertanyaan yang muncul dilembar kerja iteman, seperti:

Enter the name of the input file: WAder.dat <enter> Enter the name of the output file: outWAder.out <enter> Do you want the scores written to a file? (Y/N) Y <enter> Enter the name of the score file: SkorWAder.sor <enter> **ITEMAN ANALYSIS IS COMPLETE**

Kemudian hasil analisis iteman akan tersimpan secara otomatis pada folder

Iteman di local disk C sesuai dengan nama yang kita berikan sebelumnya.

D. Membaca Hasil Analisis Iteman


(7)

Contoh hasil analisis iteman:

Item Statistics Alternative Statistics --- --- Seq. Scale Prop. Point Prop. Point No. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key ---- --- --- --- --- --- --- --- --- ---

1 0-1 0.645 0.587 0.457 A 0.117 -0.232 -0.142 B 0.645 0.587 0.457 * C 0.134 -0.472 -0.300 D 0.034 -0.285 -0.119 E 0.058 -0.325 -0.161 Other 0.011 -0.390 -0.108 2 0-2 0.905 0.637 0.367 A 0.012 -0.465 -0.135 B 0.905 0.637 0.367 * C 0.038 -0.472 -0.204 D 0.023 -0.505 -0.185 E 0.016 -0.494 -0.157 Other 0.005 -0.402 -0.085 3 0-3 0.718 0.522 0.392 A 0.022 -0.217 -0.078 B 0.134 -0.464 -0.294 C 0.033 -0.409 -0.169 D 0.718 0.522 0.392 * E 0.078 -0.146 -0.079 Other 0.015 -0.348 -0.109 4 0-4 0.796 0.619 0.435 A 0.021 -0.365 -0.129 B 0.033 -0.485 -0.200 C 0.796 0.619 0.435 * D 0.054 -0.388 -0.189 E 0.085 -0.430 -0.240 Other 0.010 -0.414 -0.111

Scale Statistics ---

Scale: 0 N of Items 20 N of Examinees 2011 Mean 11.868 Variance 10.745 Std. Dev. 3.278 Skew -0.452 Kurtosis 0.109


(8)

Maximum 20.000 Median 12.000 Alpha 0.650 SEM 1.938 Mean P 0.593 Mean Item-Tot. 0.366 Mean Biserial 0.492 Keterangan:

Prop. Correct = indeks kesulitan aitem,

Biser dan Point Biser. = korelasi Biserial dan Korelasi Point Biserial (indeks diskriminasi aitem),

Alt. = alternative/pilihan jawaban,

Prop. Endorsing = proporsi Jawaban pada setiap option Alpha = koefisien reliabilitas

E. Output Analisis Aitem Subtes RA dengan Iteman


(9)

MicroCAT (tm) Testing System

Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation Item and Test Analysis Program -- ITEMAN (tm) Version 3.00

Item analysis for data from file warevis.dat Page 1 Item Statistics Alternative Statistics

--- --- Seq. Scale Prop. Point Prop. Point No. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key ---- --- --- --- --- --- --- --- --- ---

1 0-1 0.645 0.587 0.457 A 0.117 -0.232 -0.142 B 0.645 0.587 0.457 C 0.134 -0.472 -0.300 D 0.034 -0.285 -0.119 E 0.058 -0.325 -0.161 Other 0.011 -0.390 -0.108 2 0-2 0.905 0.637 0.367 A 0.012 -0.465 -0.135 B 0.905 0.637 0.367 C 0.038 -0.472 -0.204 D 0.023 -0.505 -0.185 E 0.016 -0.494 -0.157 Other 0.005 -0.402 -0.085 3 0-3 0.718 0.522 0.392 A 0.022 -0.217 -0.078 B 0.134 -0.464 -0.294 C 0.033 -0.409 -0.169 D 0.718 0.522 0.392 E 0.078 -0.146 -0.079 Other 0.015 -0.348 -0.109 4 0-4 0.796 0.619 0.435 A 0.021 -0.365 -0.129 B 0.033 -0.485 -0.200 C 0.796 0.619 0.435 D 0.054 -0.388 -0.189 E 0.085 -0.430 -0.240 Other 0.010 -0.414 -0.111 5 0-5 0.807 0.552 0.383 A 0.040 -0.310 -0.137 B 0.015 -0.395 -0.124 C 0.807 0.552 0.383 D 0.100 -0.408 -0.238


(10)

E 0.012 -0.521 -0.149 Other 0.026 -0.356 -0.135 6 0-6 0.778 0.644 0.461 A 0.034 -0.285 -0.119 B 0.016 -0.347 -0.112 C 0.778 0.644 0.461 D 0.048 -0.448 -0.209 E 0.100 -0.521 -0.305 Other 0.023 -0.359 -0.131

MicroCAT (tm) Testing System

Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation Item and Test Analysis Program -- ITEMAN (tm) Version 3.00

Item analysis for data from file warevis.dat Page 2 Item Statistics Alternative Statistics

--- --- Seq. Scale Prop. Point Prop. Point No. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key ---- --- --- --- --- --- --- --- --- ---

7 0-7 0.757 0.535 0.390 A 0.019 -0.371 -0.126 B 0.041 -0.373 -0.165 C 0.757 0.535 0.390 D 0.129 -0.378 -0.237 E 0.046 -0.282 -0.130 Other 0.008 -0.493 -0.121 8 0-8 0.702 0.361 0.273 A 0.081 -0.106 -0.058 B 0.033 -0.325 -0.135 C 0.016 -0.475 -0.151 D 0.702 0.361 0.273 E 0.156 -0.226 -0.149 Other 0.012 -0.371 -0.108 9 0-9 0.421 0.442 0.350 A 0.170 -0.367 -0.247 B 0.257 -0.029 -0.021 C 0.010 -0.566 -0.154 D 0.421 0.442 0.350 E 0.127 -0.176 -0.110 Other 0.015 -0.473 -0.149


(11)

10 0-10 0.776 0.663 0.476 A 0.776 0.663 0.476 B 0.027 -0.403 -0.155 C 0.153 -0.540 -0.354 D 0.008 -0.549 -0.135 E 0.030 -0.362 -0.145 Other 0.006 -0.533 -0.117 11 0-11 0.428 0.525 0.417 A 0.091 -0.364 -0.207 B 0.055 -0.312 -0.152 C 0.325 -0.164 -0.126 D 0.075 -0.212 -0.114 E 0.428 0.525 0.417 Other 0.028 -0.364 -0.142 12 0-12 0.332 0.497 0.383 A 0.332 0.497 0.383 B 0.066 -0.053 -0.027 C 0.041 -0.196 -0.087 D 0.391 -0.430 -0.339 E 0.159 0.093 0.062 Other 0.012 -0.433 -0.124

MicroCAT (tm) Testing System

Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation Item and Test Analysis Program -- ITEMAN (tm) Version 3.00

Item analysis for data from file warevis.dat Page 3 Item Statistics Alternative Statistics

--- --- Seq. Scale Prop. Point Prop. Point No. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key ---- --- --- --- --- --- --- --- --- ---

13 0-13 0.323 0.374 0.287 A 0.323 0.374 0.287 B 0.366 -0.050 -0.039 C 0.033 -0.184 -0.076 D 0.097 -0.139 -0.081 E 0.129 -0.247 -0.155 Other 0.052 -0.244 -0.117


(12)

14 0-14 0.620 0.437 0.343 A 0.061 -0.033 -0.016 B 0.620 0.437 0.343 C 0.225 -0.185 -0.133 D 0.009 -0.644 -0.165 E 0.075 -0.507 -0.272 Other 0.010 -0.714 -0.194 15 0-15 0.476 0.383 0.306 A 0.045 -0.241 -0.110 B 0.019 -0.228 -0.078 C 0.476 0.383 0.306 D 0.294 -0.105 -0.080 E 0.140 -0.247 -0.158 Other 0.025 -0.470 -0.177 16 0-16 0.339 0.526 0.407 A 0.339 0.526 0.407 B 0.019 -0.340 -0.116 C 0.123 -0.151 -0.094 D 0.159 -0.081 -0.054 E 0.326 -0.263 -0.202 Other 0.033 -0.426 -0.176 17 0-17 0.577 0.329 0.261 A 0.029 -0.028 -0.011 B 0.247 -0.074 -0.054 C 0.037 -0.384 -0.165 D 0.577 0.329 0.261 E 0.067 -0.200 -0.104 Other 0.044 -0.501 -0.227 18 0-18 0.399 0.433 0.342 A 0.110 0.022 0.013 B 0.086 -0.064 -0.036 C 0.256 -0.243 -0.179 D 0.069 -0.197 -0.103 E 0.399 0.433 0.342 Other 0.081 -0.381 -0.210 MicroCAT (tm) Testing System

Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation Item and Test Analysis Program -- ITEMAN (tm) Version 3.00

Item analysis for data from file warevis.dat Page 4


(13)

Item Statistics Alternative Statistics --- --- Seq. Scale Prop. Point Prop. Point No. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key ---- --- --- --- --- --- --- --- --- ---

19 0-19 0.325 0.430 0.330 A 0.203 -0.140 -0.098 B 0.325 0.430 0.330 C 0.105 -0.149 -0.088 D 0.187 -0.065 -0.045 E 0.134 -0.080 -0.051 Other 0.045 -0.556 -0.255 20 0-20 0.745 0.344 0.253 A 0.025 0.033 0.012 B 0.085 -0.061 -0.034 C 0.745 0.344 0.253 D 0.071 -0.224 -0.118 E 0.018 -0.293 -0.098 Other 0.057 -0.525 -0.258

MicroCAT (tm) Testing System

Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation Item and Test Analysis Program -- ITEMAN (tm) Version 3.00

Item analysis for data from file warevis.dat Page 5

There were 2011 examinees in the data file. Scale Statistics

--- Scale: 0 --- N of Items 20 N of Examinees 2011 Mean 11.868 Variance 10.745 Std. Dev. 3.278 Skew -0.452 Kurtosis 0.109


(14)

Minimum 0.000 Maximum 20.000 Median 12.000 Alpha 0.650 SEM 1.938 Mean P 0.593 Mean Item-Tot. 0.366 Mean Biserial 0.492

LAMPIRAN III

OUTPUT ANALISIS KORELASI SUBTES RA DENGAN 8 SUBTES LAINNYA PADA IST DENGAN BANTUAN SPSS VERSI 16 A. Output Validitas Konstrak Subtes WA

Correlations

Zscore(WA) Zscore(SE)

Zscore(WA) Pearson Correlation 1 .552**

Sig. (1-tailed) .000

N 2011 2011

Zscore(SE) Pearson Correlation .552** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(SE) Zscore(AN)

Zscore(SE) Pearson Correlation 1 .676**

Sig. (1-tailed) .000

N 2011 2011

Zscore(AN) Pearson Correlation .676** 1


(15)

Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(SE) Zscore(GEE)

Zscore(SE) Pearson Correlation 1 .494**

Sig. (1-tailed) .000

N 2011 2011

Zscore(GEE) Pearson Correlation .494** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(SE) Zscore(RA)

Zscore(SE) Pearson Correlation 1 .544**

Sig. (1-tailed) .000

N 2011 2011

Zscore(RA) Pearson Correlation .544** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(SE) Zscore(ZR)

Zscore(SE) Pearson Correlation 1 .544**

Sig. (1-tailed) .000

N 2011 2011

Zscore(ZR) Pearson Correlation .544** 1 Sig. (1-tailed) .000


(16)

Correlations

Zscore(SE) Zscore(ZR)

Zscore(SE) Pearson Correlation 1 .544**

Sig. (1-tailed) .000

N 2011 2011

Zscore(ZR) Pearson Correlation .544** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(SE) Zscore(FA)

Zscore(SE) Pearson Correlation 1 .379**

Sig. (1-tailed) .000

N 2011 2011

Zscore(FA) Pearson Correlation .379** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(SE) Zscore(WU)

Zscore(SE) Pearson Correlation 1 .444**

Sig. (1-tailed) .000

N 2011 2011

Zscore(WU) Pearson Correlation .444** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).


(17)

Correlations

Zscore(SE) Zscore(ME)

Zscore(SE) Pearson Correlation 1 .635**

Sig. (1-tailed) .000

N 2011 2011

Zscore(ME) Pearson Correlation .635** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(WA) Zscore(AN)

Zscore(WA) Pearson Correlation 1 .579**

Sig. (1-tailed) .000

N 2011 2011

Zscore(AN) Pearson Correlation .579** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(WA) Zscore(GEE)

Zscore(WA) Pearson Correlation 1 .524**

Sig. (1-tailed) .000

N 2011 2011

Zscore(GEE) Pearson Correlation .524** 1 Sig. (1-tailed) .000

N 2011 2011


(18)

Correlations

Zscore(WA) Zscore(RA)

Zscore(WA) Pearson Correlation 1 .548**

Sig. (1-tailed) .000

N 2011 2011

Zscore(RA) Pearson Correlation .548** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(WA) Zscore(ZR)

Zscore(WA) Pearson Correlation 1 .546**

Sig. (1-tailed) .000

N 2011 2011

Zscore(ZR) Pearson Correlation .546** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(WA) Zscore(FA)

Zscore(WA) Pearson Correlation 1 .379**

Sig. (1-tailed) .000

N 2011 2011

Zscore(FA) Pearson Correlation .379** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).


(19)

Correlations

Zscore(WA) Zscore(WU)

Zscore(WA) Pearson Correlation 1 .384**

Sig. (1-tailed) .000

N 2011 2011

Zscore(WU) Pearson Correlation .384** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(WA) Zscore(ME)

Zscore(WA) Pearson Correlation 1 .540**

Sig. (1-tailed) .000

N 2011 2011

Zscore(ME) Pearson Correlation .540** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(AN) Zscore(GEE)

Zscore(AN) Pearson Correlation 1 .509**

Sig. (1-tailed) .000

N 2011 2011

Zscore(GEE) Pearson Correlation .509** 1 Sig. (1-tailed) .000

N 2011 2011


(20)

Correlations

Zscore(AN) Zscore(RA)

Zscore(AN) Pearson Correlation 1 .604**

Sig. (1-tailed) .000

N 2011 2011

Zscore(RA) Pearson Correlation .604** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(AN) Zscore(ZR)

Zscore(AN) Pearson Correlation 1 .604**

Sig. (1-tailed) .000

N 2011 2011

Zscore(ZR) Pearson Correlation .604** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(AN) Zscore(FA)

Zscore(AN) Pearson Correlation 1 .410**

Sig. (1-tailed) .000

N 2011 2011

Zscore(FA) Pearson Correlation .410** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).


(21)

Correlations

Zscore(AN) Zscore(WU)

Zscore(AN) Pearson Correlation 1 .434**

Sig. (1-tailed) .000

N 2011 2011

Zscore(WU) Pearson Correlation .434** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(AN) Zscore(ME)

Zscore(AN) Pearson Correlation 1 .597**

Sig. (1-tailed) .000

N 2011 2011

Zscore(ME) Pearson Correlation .597** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(GEE) Zscore(RA)

Zscore(GEE) Pearson Correlation 1 .492**

Sig. (1-tailed) .000

N 2011 2011

Zscore(RA) Pearson Correlation .492** 1

Sig. (1-tailed) .000

N 2011 2011


(22)

Correlations

Zscore(GEE) Zscore(ZR)

Zscore(GEE) Pearson Correlation 1 .490**

Sig. (1-tailed) .000

N 2011 2011

Zscore(ZR) Pearson Correlation .490** 1

Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(GEE) Zscore(FA)

Zscore(GEE) Pearson Correlation 1 .348**

Sig. (1-tailed) .000

N 2011 2011

Zscore(FA) Pearson Correlation .348** 1

Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(GEE) Zscore(WU)

Zscore(GEE) Pearson Correlation 1 .274**

Sig. (1-tailed) .000

N 2011 2011

Zscore(WU) Pearson Correlation .274** 1

Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).


(23)

Correlations

Zscore(GEE) Zscore(ME)

Zscore(GEE) Pearson Correlation 1 .466**

Sig. (1-tailed) .000

N 2011 2011

Zscore(ME) Pearson Correlation .466** 1

Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(RA) Zscore(ZR)

Zscore(RA) Pearson Correlation 1 .999**

Sig. (1-tailed) .000

N 2011 2011

Zscore(ZR) Pearson Correlation .999** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(RA) Zscore(FA)

Zscore(RA) Pearson Correlation 1 .437**

Sig. (1-tailed) .000

N 2011 2011

Zscore(FA) Pearson Correlation .437** 1 Sig. (1-tailed) .000

N 2011 2011


(24)

Correlations

Zscore(RA) Zscore(WU)

Zscore(RA) Pearson Correlation 1 .417**

Sig. (1-tailed) .000

N 2011 2011

Zscore(WU) Pearson Correlation .417** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(RA) Zscore(ME)

Zscore(RA) Pearson Correlation 1 .519**

Sig. (1-tailed) .000

N 2011 2011

Zscore(ME) Pearson Correlation .519** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(ZR) Zscore(FA)

Zscore(ZR) Pearson Correlation 1 .436**

Sig. (1-tailed) .000

N 2011 2011

Zscore(FA) Pearson Correlation .436** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).


(25)

Correlations

Zscore(ZR) Zscore(WU)

Zscore(ZR) Pearson Correlation 1 .417**

Sig. (1-tailed) .000

N 2011 2011

Zscore(WU) Pearson Correlation .417** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(ZR) Zscore(ME)

Zscore(ZR) Pearson Correlation 1 .518**

Sig. (1-tailed) .000

N 2011 2011

Zscore(ME) Pearson Correlation .518** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(FA) Zscore(WU)

Zscore(FA) Pearson Correlation 1 .390**

Sig. (1-tailed) .000

N 2011 2011

Zscore(WU) Pearson Correlation .390** 1 Sig. (1-tailed) .000

N 2011 2011


(26)

Correlations

Zscore(FA) Zscore(ME)

Zscore(FA) Pearson Correlation 1 .335**

Sig. (1-tailed) .000

N 2011 2011

Zscore(ME) Pearson Correlation .335** 1 Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).

Correlations

Zscore(WU) Zscore(ME)

Zscore(WU) Pearson Correlation 1 .456**

Sig. (1-tailed) .000

N 2011 2011

Zscore(ME) Pearson Correlation .456** 1

Sig. (1-tailed) .000

N 2011 2011

**. Correlation is significant at the 0.01 level (1-tailed).


(27)

DAFTAR PUSTAKA

Anastasi, A. & Urbina, S. (2003). Psychological Testing. New Jersey : Prentice- Hall Inc.

Adolf. (2010, Nopember). Analisis Butir Soal dengan Iteman. (27 hal). On-line. Available Email: adolfr@blogspot.com

Azwar, S. (2007). Dasar-dasar psikometri (cetakan VI). Yogyakarta: Pustaka Pelajar.

---. (2004). Metode Penelitian. Yogyakarta : Pustaka pelajar. ---. (2007). Reliabilitas dan validitas. Yogyakarta: Pustaka Pelajar. ---. (2007). Sikap Manusia. Yogyakarta: Pustaka Pelajar.

---. (2005). Tes prestasi: Fungsi pengembangan dan pengukuran prestasi

belajar. Yogyakarta: Pustaka Pelajar.

Crocker, L & Algina, J. (2005). Introduction to Classical and Modern Test

Theory. Florida : Harcourt Brace Jovanovich College Publishers.

Bawono, Bernadetta A. (2008). Uji Aspek-aspek Psikometrik Subtes Merkaufgaben dari Batterai Intelligenz Structure Test. Skripsi. Jakarta: Unika Atmajaya


(28)

Gayatri, Ayu. (2008). Pengujian Validitas dan Reliabilitas Intelligenz Structure Test Subtes Wortauswahl (WA). Skripsi. Jakarta: Unika Atmajaya

Gregory, R.J. (2000). Psychological Testing : History, Principles and

Applications. Boston: Allyn & Bacon

Guilford,J.P., B. Fruchter (1978), Fundamental Statistics In Psychology And

Education, Tokyo: McGraw-HillKogakusha, Ltd.

Gunarsa, Singgih. (2000). Psikologi Praktis: Anak, Remaja dan Keluarga. BPK Jakarta: Gunung Mulia

Hamidah,. 2000. Uji Validitas dan Reliabilitas Item Tes IST (Intelligenz Strukture

Tes). Surabaya: Perpustakaan Universitas Air Langga

Hayet, Brett.K, Evan Heit, & Haruka Swendsen. (2010). Inductive Reasoning. Advanced review: WIREs Cognitive Science

Heit, Evan. (2007). Models of Inductive Reasoning. Cambridge University Press. Hirzithariqi (2009, November).Biro Psikologi di Indonesia. [On-line serial].

Available E-mail: hirzithariqi.wordpress.com.

Kaplan, R. M. & Saccuzzo, (2005). Psychological testing: Principles, application,

and issues (6th ed.). Belmont: Thomson Wadsworth.

Kerlinger, F.N. & Lee.H.B. (2006). Foundation of behavioral Research (Edisi Terjemahan). New York: Hartcourt College Publisher.

Kumar, R. (1996). Research Metodology. New Delhi: Sage Publication.


(29)

Lababa, Junaidi. (2008). Analisis Butir Soal dengan Teori Tes Klasik: Sebuah

Pengantar. Volume 5. Iqra’.

Murphy, Kevin R. & Davidshofer, Charles O. (2003). Psychological testing:

Principles and application. New Jersey : Prentice-Hall Inc.

Nunnally, Jum C. (2005). Psychometric Theory (2nd ed.). New Delhi: Tata McGraw-Hill Publishing Company Limited.

Reed, Stephen K. (2004). Cognition : Theory and Application (Sixth Edition). United State of America: San Diego University

Stenberg, R.J. (1994). Encyclopedia of Human Intelligence (Jilid 1 & 2). New York: Macmillan

Suryabrata, S. (2005). Pengembangan Alat Ukur Psikologi. Yogyakarta: Andi. Tiarsarani (2008). Uji Psikometri pada Intelligenz Structure Test Subtes Zahlen


(30)

BAB III

METODE PENELITIAN

A. Jenis Penelitian

Penelitian ini merupakan jenis penelitian non-eksperimental, yang artinya penelitian tidak menciptakan atau memanipulasi variabel-variabel tertentu. Menurut Kerlinger (2006), penelitian non-eksperimental adalah penelitian yang tidak melakukan kontrol dan manipulasi terhadap variabel-variabel bebas.

Sesuai dengan tujuan penelitian ini yakni untuk menganalisa karakteristik psikometri pada subtes WA, maka pendekatan yang digunakan adalah pendekatan kuantitatif, yang menekankan pengukuran dengan menggunakan teknik statistika (Kumar, 1996 ). Jika dilihat dari kedalaman analisanya, penelitian ini merupakan penelitian deskriptif, yaitu penelitian yang berusaha menganalisa dan menyajikan secara sistematik dan akurat mengenai fakta dan karakteristik mengenai populasi atau mengenai bidang tertentu (Azwar, 2004)

B. Data Penelitian

Data yang digunakan dalam penelitian ini adalah jenis data sekunder. Menurut Kumar (1999), data sekunder merupakan data yang sudah tersedia, dapat diperoleh dari penelitian sebelumnya. Data tersebut berupa respon jawaban subjek yang pernah mengikuti tes seleksi kerja di Fakultas Psikologi Universitas Sumatera Utara, khususnya respon jawaban terhadap subtes Wortauswahl (WA).


(31)

Berdasarkan data respon jawaban dari 2011 subjek diketahui 1273 orang berjenis kelamin laki-laki dan 699 orang berjenis kelamin perempuan serta 69 lembar lainnya tidak tercantum identitas jenis kelaminnya.

C. Metode Pengumpulan Data

Metode pengumpulan data pada penelitian ini adalah metode dokumentasi, dengan menggunakan data sekunder sebagai data penelitian. Data diperoleh dari hasil skor IST beberapa perusahaan yang didokumentasikan oleh Biro Fakultas Psikologi Universitas Sumatera Utara.

D. Persiapan dan Pelaksanaan Penelitian

1. Persiapan Izin Penelitian

a. Mengurus surat permohonan untuk melakukan penelitian di bagian administrasi pendidikan Fakultas Psikologi USU yang ditujukan kepada Ketua P3M Fakultas Psikologi USU.

b. Mengajukan surat permohonan izin penelitian kepada Ketua P3M Fakultas Psikologi USU..

2. Pelaksanaan Penelitian

Penelitian ini dapat dilaksanakan ketika data-data skor IST terkumpul seluruhnya berjumlah 2011 lembar jawaban. Data yang sudah diperoleh ditabulasi dengan menggunakan Microsoft Excel. Langkah selanjutnya, data yang sudah ditabulasi di lembar kerja excel, dipindahkan ke dalam lembar kerja SPSS. Data yang sudah dipindahkan ke dalam lembar kerja SPSS disimpan dalam bentuk


(32)

notepad. Kemudian analisis indeks kesulitan aitem, indeks daya diskriminasi aitem, efektifitas distraktor dan reliabilitas tes akan dilakukan dengan menggunakan program Iteman versi 3.0. Untuk validitas subtes WA, digunakan program SPSS. Selain itu, SPSS juga digunakan untuk melihat indeks daya diskriminasi aitem. Dalam ha ini indeks daya diskriminasi aitem dilihat dengan dua metode, yaitu metode extreme group (menggunakan bantuan proogram SPSS) dan metode korelasi aitem-total (menggunakan bantuan Program Iteman)

E. Program Komputer yang Digunakan

Dalam mengolah data penelitian ini menggunakan alat bantu berupa software program computer, diantaranya:

1. Microsoft Excel diproduksi oleh Microsoft Corp yang diintegrasikan

dalam paket Microsoft Office System 2007. Aplikasi ini digunakan untuk proses tabulasi skor subtes WA, yang kemudian akan dipindahkan ke lembar kerja Program Iteman dan program kerja SPSS untuk selnjutnya mempermudah proses analisa karakteristik psikometri yang akan dilakukan. Selain itu, program ini juga digunakan untuk menghitung indeks daya diskriminasi aitem dengan metode extreme-group.

2. SPSS (Statistical Programme for Social Science) versi 16.00.

Digunakan untuk analisa karakteristik psikometri khususnya validitas dan daya diskriminasi aitem pada subtes WA.

3. Program Iteman versi 3.0


(33)

Program ini dikembangkan oleh Assesment System Corporation pada tahun 1982. Program ini digunakan untuk menganalisis karakteristik psikometri, mulai dari indeks kesulitan aitem (p), indeks daya diskriminasi aitem (d), efektivitas distraktor dan reliabilitas dari subtes WA.

F. Analisis Data

Penelitian ini menggunakan pendekatan teori skor murni klasik (CTT) dalam menganalisis karakteristik psikometri dari subtes WA. Proses analisis yang dilakukan adalah sebagai berikut:

1. Analisis indeks kesulitan aitem

Secara teoritik dikatakan bahwa p sebenarnya merupakan probabilitas empirik untuk lulus aitem tertentu bagi kelompok subjek tertentu. Analisis indeks kesulitan aitem dilakukan dengan menggunakan Formula 6.

p = ni / N Keterangan:

p = indeks kesulitan aitem

ni = banyaknya subjek yang menjawab aitem dengan benar

N = banyaknya subjek yang menjawab aitem.

Nilai p yang semakin tinggi menunjukkan bahwa aitem yang bersangkutan semakin mudah. Nilai p berkisar dari 0 sampai dengan angka 1. Menurut Azwar (2007), harga p terbaik adalah yang sesuai yang sesuai dengan tujuan tes yang bersangkutan. Sesuai dengan tujuan, IST dipakai untuk seleksi dan penempatan karyawan, maka untuk memenuhi tujuan ini sebaiknya nilai p yang dimiliki oleh


(34)

aitem-aitem dalam subtes WA harus rendah (aitem sulit). Menurut Allen & Yen (dalam Lababa, 2008), suatu aitem yang tergolong sulit adalah aitem yang memiliki nilai p < 0.30.

Proses analisis indeks kesulitan aitem subtes WA ini dilakukan dengan menggunakan bantuan Program Iteman. Data skor subjek yang sudah ditabulasi dengan excel dipindahkan ke dalam lembar kerja SPSS, kemudian disimpan dalam bentuk notepad untuk dianalisis dengan program iteman. Dalam lembar output

iteman, indeks kesulitan masing-masing aitem ditunjukkan pada kolom prop. Correct.

2. Analisis indeks diskriminasi aitem

Indeks diskriminasi dilihat untuk mengetahui apakah alat tes mampu membedakan individu-individu yang memang benar-benar memiliki performansi yang baik dan yang tidak. Indeks diskriminasi bergerak dari angka -1 sampai dengan +1, namun yang memiliki arti hanya nilai d yang positif. Semakin harga d mendekati +1, maka semakin bagus aitem tersebut.

Menurut Ebel (dalam Crocker & Algina, 2005) pada Tabel 2, suatu aitem yang memiliki daya diskriminasi yang bagus apabila nilai d ≥ 0.40. Sementara nilai d yang berada pada kisaran 0.30 sampai 0.39 dianggap lumayan bagus dan tidak memerlukan revisi. Dalam penelitian ini, aitem yang baik adalah aitem yang

memiliki d ≥ 0.30

Proses analisis indeks daya diskriminasi aitem dalam penelitian ini dilakukan dengan dua cara, yaitu dengan metode extreme group dan metode korelasi aitem-total. Dengan metode extreme group, diharapkan bisa melihat


(35)

perbedaan antara Kelompok Tinggi dan Kelompok Rendah. Proses ini dilakukan dengan bantuan program SPSS. Proses ini diawali dengan memisahkan 27% subjek yang mmemiliki skor tertinggi dan 27% subjek yang memiliki skor terendah.

Sedangkan dengan metode korelasi aitem-total diharapkan dapat melihat kesesuaian fungsi aitem dengan fungsi tes dalam mengungkap perbedaan individual. Proses ini dilakukan dengan menggunakan bantuan program iteman. Langkah yang dilakukan sama dengan analisis indeks kesulitan aitem. Dalam output iteman, indeks daya diskriminasi ditunjukkan pada kolom point Biser. 3. Analisis efektivitas distraktor pada setiap aitem

Efektivitas distraktor dilihat dengan bantuan program iteman dan ditetapkan berdasarkan dua kriteria, yaitu; (a) distraktor dipilih oleh siswa dari Kelompok Rendah, dan (b)pemilih distraktor tersebar relative proporsional pada masing-masing distrakktor yang ada (Azwar, 2007). Artinya, pilihan-pilihan jawaban yang digunakan sebagai penggecoh mayoritas akan dipilih subjek dari Kelompok Rendah dan relatif tersebar pada setiap pilihan.

4. Analisis Reliabilitas subtes WA

Reliabilitas pada dasarnya merupakan ketetapan atau derajat konsistensi performansi relative dari individu yang dikenai tes ketika diberikan tes yang sama secara berulang atau tes yang paralel. Reliabilitas dalam penelitian ini dihitung dengan menggunakan pendekatan konsistensi internal (internal-consistency) yang bertujuan untuk melihat konsistensi respon-respon individu pada satu belahan dengan respon-responnya pada belahan lainnya (Anastasi & Urbina, 2003).


(36)

Teknik komputasi statistik yang digunakan dalam pendekatan konsistensi internal ini adalah formula Kuder-Richardson (KR’20). KR’20 dapat dikenakan pada data skor dikotomi dari tes yang seolah-olah dibagi-bagi menjadi belahan sebanyak aitemnya. Formula ini dapat digunakan jika aitem dikotomi, jumlah aitem sedikit dan membelahan tes sebanyak jumlah aitem. Formula KR’20 terdapat pada formula 14.

5. Analisis Validitas Konstruk Subtes WA

Validitas konstrak subtes WA dilihat dengan menggunakan matriks validasi berdasarkan pendekatan multitrait-multimethode dimana skor subjek pada subtes WA dikorelasikan dengan masing-masing skor subjek pada 8 subtes IST lainnya, yaitu: Satzergaenzung (SE), Analogien (AN), Gemeinsamkeiten (GE),

Rechenaufgaben (RA), Zahlenreinhen (ZR), Figurenauswahl (FA),

Wuerfelaufgaben (WU) dan Merkaufgaben (ME).

Melalui pendekatan ini, akan dilihat bagaimana validitas konstrak subtes WA. Validitas konvergen akan ditandai dengan adanya korelasi yang tinggi antara subtes WA dengan subtes lain dalam IST. Sedangkan validitas diskriminan ditandai dengan adanya korelasi yang rendah antara subtes WA dengan subtes IST lainnya. Estimasi validitas konstruk subtes WA menggunakan korelasi

pearson product moment dengan bantuan SPSS for Windows versi 16.0.


(37)

BAB IV

HASIL DAN PEMBAHASAN

Pada bab 4 ini, akan disajikan hasil analisis karakteristik psikometri subtes WA. Analisis ini didasarkan pada pendekatan CTT dan dalam prosesnya dibantu dengan Program Iteman Version 3,00 MicroCAT (tm) Testing dan Program SPSS versi 16. Selanjutnya hasil yang diperoleh akan dibahas sesuai dengan teori-teori yang sudah dipaparkan pada bab 2.

A. Deskripsi Hasil

1. Analisis Indeks Kesulitan Aitem

Indeks kesulitan aitem menunjukkan proporsi subjek yang menjawab dengan benar pada masing-masing aitem dalam subtes WA. Apabila proporsi subjek yang menjawab benar pada suatu aitem besar, berarti aitem tersebut relatif mudah dan demikian pula sebaliknya.

Dalam analisis ini, mudah sulitnya aitem didasarkan pada kategori menurut Allen dan Yen (dalam Lababa, 2008), yaitu p < 0.3 dikategorikan sulit, 0.3<p<0.7 dikategorikan sedang, dan p > 0.7 dikategorikan mudah. Hasil lengkap analisis indeks kesulitan aitem dengan menggunakan bantuan Program Iteman


(38)

Tabel 3 Indeks kesulitan aitem subtes WA

Keterangan :

p = Indeks Kesukaran Aitem TS = Tidak Sesuai

S = Sesuai

Hasil analisis indeks kesulitan aitem pada Tabel 3 menunjukkan bahwa 11 aitem memiliki tingkat kesulitan kategori sedang dan 9 aitem memiliki tingkat kesulitan kategori mudah, sedangkan kategori sulit tidak ada. Artinya semua aitem dalam subtes WA tidak ada yang sesuai dengan tujuan IST disusun yaitu untuk tujuan seleksi yang diharapkan aitem-aitem dalam subtes WA berkategori Sulit yaitu memiliki nilai p kecil dari 0,3. Secara ringkas hasil analisis aitem berdasarkan nilai p disajikan ada Tabel 4.

Tabel 4 Analisis aitem berdasarkan nila p

No P Kategori Nomor aitem Jumlah

1 p <0,3 Sulit - -

2 0,3≤ p ≤0,7 Sedang 21, 29, 31, 32, 33, 34, 35, 36, 37, 38, 39

11 (55 %)

3 p>0,7 Mudah 22, 23, 24, 25, 26, 27,

28, 30, 40

9 (45 %)

No Aitem

p keterangan Status No Aitem

p keterangan Status

21 0.645 Sedang TS 31 0.428 Sedang TS

22 0.905 Mudah TS 32 0.332 Sedang TS

23 0.718 Mudah TS 33 0.323 Sedang TS

24 0.796 Mudah TS 34 0.620 Sedang TS

25 0.807 Mudah TS 35 0.476 Sedang TS

26 0.778 Mudah TS 36 0.339 Sedang TS

27 0.757 Mudah TS 37 0.577 Sedang TS

28 0.702 Mudah TS 38 0.399 Sedang TS

29 0.421 Sedang TS 39 0.325 Sedang TS

30 0.776 Mudah TS 40 0.745 Mudah TS


(39)

2. Analisis Indeks Daya Diskriminasi Aitem

Indeks daya diskriminasi dalam penelitian ini dilihat dengan dua cara yaitu dengan metode extreme group dan metode korelasi aitem-total. Metode extreme

group bertujuan untuk melihat discriminating power aitem dalam membedakan

individu-individu yang memiliki trait yang diukur dan yang tidak memiliki. Metode ini dilakukan dengan melibatkan 543 subjek Kelompok Tinggi (27% skor tertinggi dari 2011 subjek) dan 543 subjek Kelompok Rendah (27% skor terendah dari 2011 subjek). Selanjutnya indeks diskriminasi diperoleh dari selisih indeks kesulitan aitem pada subjek Kelompok Tinggi dengan indeks kesulitan aitem pada subjek Kelompok rendah. Sementara nilai indeks kesulitan aitem masing-masing kelompok merupakan nilai rata-rata (mean) pada masing-masing kelompok yang diperoleh dengan bantuan SPSS.

Kualitas indeks daya diskriminansi aitem dievaluasi dengan menggunakan kategori Ebel (dalam Azwar, 2005), yaitu d ≥ 0,40 dikategorikan sangat bagus,

0,30 ≤ d ≤ 0,39 dikategorikan lumayan bagus, 0,20 ≤ d ≤ 0,29 dikategorikan belum memuaskan, masih membutuhkan revisi, dan p < 0.20 dikategorikan jelek dan harus dibuang. Nilai indeks diskriminasi dengan metode extreme group dapat dilihat pada Tabel 5.


(40)

Tabel 5 Indeks Daya Diskriminasi Aitem Subtes WA dengan metode extreme group.

No Aitem pT pR d Keterangan

21 0.87 0.35 0.52 Sangat Bagus

22 0.98 0.78 0.20 Revisi

23 0.89 0.49 0.40 Sangat Bagus

24 0.95 0.58 0.37 Lumayan Bagus

25 0.96 0.63 0.33 Lumayan Bagus

26 0.95 0.55 0.40 Sangat Bagus

27 0.91 0.52 0.39 Lumayan Bagus

28 0.86 0.57 0.29 Revisi

29 0.68 0.21 0.47 Sangat Bagus

30 0.97 0.50 0.47 Sangat Bagus

31 0.70 0.21 0.49 Sangat Bagus

32 0.59 0.12 0.47 Sangat Bagus

33 0.54 0.20 0.34 Lumayan Bagus

34 0.81 0.41 0.40 Sangat Bagus

35 0.67 0.30 0.37 Lumayan Bagus

36 0.61 0.12 0.49 Sangat Bagus

37 0.71 0.45 0.26 Revisi

38 0.66 0.24 0.42 Sangat Bagus

39 0.55 0.17 0.38 Lumayan Bagus

40 0.85 0.64 0.21 Revisi

Keterangan:

pT : Indeks kesulitan pada Kelompok Tinggi

pR : Indeks kesulitan pada Kelompok Rendah

d : Indeks diskriminasi Aitem

Hasil analisis indeks daya diskriminasi aitem dengan metode extreme group pada Tabel 5 menunjukkan bahwa 10 aitem memiliki daya diskriminasi Sangat bagus, 6 aitem memiliki daya diskriminasi lumayan bagus dan 4 aitem membutuhkan revisi.


(41)

Metode kedua yang digunakan untuk melihat daya diskriminasi aitem adalah dengan metode korelasi aitem-total dengan menggunakan bantuan program

Iteman Version 3,00 MicroCAT (tm) Testing. Metode korelasi aitem total ini

bertujuan untuk melihat kesesuaian fungsi aitem dengan fungsi skala / tes dalam mengungkap perbedaan individu. Korelasi yang semakin tinggi mendekati angka 1 menunjukkan bahwa aitem tersebut mengukur hal yang sama dengan apa yang diukur oleh alat tes. Hasilnya dapat dilihat pada Tabel 6.

Tabel 6 Hasil Analisis Indeks Daya Diskriminasi Aitem Subtes WA dengan bantuan program Iteman.

No aitem Nilai d

Keterangan No aitem Nilai d

Keterangan 21 0.457 Sangat Bagus 31 0.417 Sangat Bagus 22 0.367 Lumayan Bagus 32 0.383 Lumayan Bagus

23 0.392 Lumayan Bagus 33 0.287 Revisi

24 0.435 Sangat Bagus 34 0.343 Lumayan Bagus 25 0.383 Lumayan Bagus 35 0.306 Lumayan Bagus 26 0.461 Sangat Bagus 36 0.407 Sangat Bagus

27 0.390 Lumayan Bagus 37 0.261 Revisi

28 0.273 Revisi 38 0.342 Lumayan Bagus

29 0.350 Lumayan Bagus 39 0.330 Lumayan Bagus 30 0.476 Sangat Bagus 40 0.253 Revisi

Hasil analisis indeks daya diskriminasi aitem dengan metode korelasi aitem-total dengan menggunakan bantuan Program Iteman pada Tabel 6 menunjukkan bahwa 6 aitem memiliki daya diskriminasi sangat bagus, 10 aitem memiliki daya diskriminasi lumayan bagus, dan 4 aitem membutuhkan revisi. Deskripsi hasil analisis 20 aitem subtes WA berdasarkan nilai indeks diskriminasi dapat dilihat pada Tabel 7.


(42)

Tabel 7 Analisis aitem berdasarkan nilai d

d Status Metode korelasi aitem-total Metode extreme group Nomor Aitem Jumlah No. aitem Jumlah

≥ 0.40 Sangat

bagus

21,24,26,30,31,36 6 (30%) 21,23,26,29, 30,31,32,34,

36,38

10(50%) 0.30

sd 0.39

Lumayan Bagus

22,23,25,27,29,32,34 ,35, 38,39

10 (50%) 24,25,27,33, 35,39

6 (30%) 0.20

sd 0.29

Revisi 28,33,37,40 4 (20%) 22,28,37,40 4 (20%)

< 0.20 Jelek - -

Jumlah 20

(100%)

20(100% )

3. Analisis Efektivitas Distraktor

Analisis respon terhadap pilihan jawaban akan dilihat dari hasil program

iteman versi 3.0 dan untuk mengetahui perbedaan proporsi sebaran jawaban antara

Kelompok Tinggi dan Kelompok Rendah. Hasil dari analisis efektivitas distrakktor dengan bantuan program iteman dapat dilihat pada Tabel 9.


(43)

Tabel 8 Efektivitas Distraktor Subtes WA

No Aitem

Poin biserial masing-masing Alternatif Jawaban

Keterangan

A B C D E O

21 -0.142 0.457 -0.300 -0.119 -0.161 -0.108 Efektif 22 -0.135 0.367 -0.204 -0.185 -0.157 -0.085 Efektif 23 -0.078 -0.294 -0.169 0.392 -0.079 -0.109 Efektif 24 -0.129 -0.200 0.435 -0.189 -0.240 -0.111 Efektif 25 -0.137 -0.124 0.383 -0.238 -0.149 -0.135 Efektif 26 -0.119 -0.112 0.461 -0.209 -0.305 -0.131 Efektif 27 -0.126 -0.165 0.390 -0.237 -0.130 -0.121 Efektif 28 -0.058 -0.135 -0.151 0.273 -0.149 -0.108 Efektif 29 -0.247 -0.021 -0.154 0.350 -0.110 -0.149 Efektif 30 0.476 -0.155 -0.354 -0.135 -0.145 -0.117 Efektif 31 -0.207 -0.152 -0.126 -0.114 0.417 -0.142 Efektif 32 0.383 -0.027 -0.087 -0.339 0.062 -0.124 Tidak efektif 33 0.287 -0.039 -0.076 -0.081 -0.155 -0.117 Efektif 34 -0.016 0.343 -0.133 -0.165 -0.272 -0.194 Efektif 35 -0.110 -0.078 0.306 -0.080 -0.158 -0.177 Efektif 36 0.407 -0.116 -0.094 -0.054 -0.202 -0.176 Efektif 37 -0.011 -0.054 -0.165 0.261 -0.104 -0.227 Efektif 38 0.013 -0.036 -0.179 -0.103 0.342 -0.210 Tidak efektif 39 -0.098 0.330 -0.088 -0.045 -0.051 -0.255 Efektif 40 0.012 -0.034 0.253 -0.118 -0.098 -0.258 Tidak efektif

Hasil analisis efektivitas distraktor pada Tabel 9 menunjukkan bahwa 17 aitem dari 20 aitem memiliki distraktor yang efektif dan 3 lainnya memiliki distraktor yang tidak efektif.

4. Seleksi Aitem Berdasarkan Indeks Kesulitan Aitem, Indeks Daya Diskriminasi Aitem dan Efektivitas Distraktor

Proses ini bertujuan untuk melihat status aitem-aitem subtes WA, apakah aitem-aitem tersebut masih bisa diterima, atau memerlukan revisi atau bahkan harus gugur. Status aitem diterima, revisi ataupun gugur ditentukan oleh daya


(44)

diskriminasi dan efektivitas distraktornya. Indeks kesulitan aitem tidak dijadikan patokan karena indeks kesulitan aitem tidak menunjukkan buruk tidaknya suatu aitem. Hasil analisisnya disajikan dalam Tabel 10.

Tabel 9 Seleksi Aitem Subtes WA Berdasarkan Indeks Kesulitan Aitem, Indeks Daya Diskriminasi Aitem dan Efektivitas Distraktor

No Aitem p d distraktor Status

21 0.645 0.457 Efektif Diterima

22 0.905 0.367 Efektif Diterima

23 0.718 0.392 Efektif Diterima

24 0.796 0.435 Efektif Diterima

25 0.807 0.383 Efektif Diterima

26 0.778 0.461 Efektif Diterima

27 0.757 0.390 Efektif Diterima

28 0.702 0.273 Efektif Revisi

29 0.421 0.350 Efektif Diterima

30 0.776 0.476 Efektif Diterima

31 0.428 0.417 Efektif Diterima

32 0.332 0.383 Tidak efektif Revisi

33 0.323 0.287 Efektif Revisi

34 0.620 0.343 Efektif Diterima

35 0.476 0.306 Efektif Diterima

36 0.339 0.407 Efektif Diterima

37 0.577 0.261 Efektif Revisi

38 0.399 0.342 Tidak efektif Revisi

39 0.325 0.330 Efektif Diterima

40 0.745 0.253 Tidak efektif Gugur

Keterangan:

Diterima jika: d ≥ 0.30 (Cukup bagus dan bagus sekali) semua distraktor efektif

Revisi jika: 0.20 ≤ d < 0.30 dan distraktor efektif

d ≥ 0.30 dan distraktor tidak efektif gugur jika: : d < 0.2 V 0.20 ≤ d < 0.30

distraktor tidak efektif


(45)

5. Analisis Indeks Reliabilitas

Analisis indeks reliabilitas subtes WA dilakukan dengan pendekatan konsistensi internal dengan formula estimasi koefisien reliabilitas KR-20. Formula ini dipilih dengan alasan bahwa indeks kesulitan subtes WA relative bervariasi.

Proses analisis ini dilakukan dengan bantuan program iteman yang relatif sama dengan proses analisis indeks diskriminasi aitem dan indeks kesukaran aitem subtes WA. Indeks reliabilitas subtes WA dengan menggunakan program

iteman adalah sebesar α = 0.650

6. Analisis Validitas Konstrak Subtes WA.

Untuk melihat validitas konstrak subtes WA ini, digunakan pendekatan

multitrait-multimethod, dimana pendekatan ini akan menguji serentak dua atau

lebih trait yang diukur melalui dua atau lebih metode. Pendekatan ini digunakan karena sembilan subtes IST merupakan subtes yang independen dan dapat berdiri sendiri. Melalui pendekatan multitrait-multimethod ini akan dilihat validitas konnvergen dan diskriminan, dimana validitas konvergen ditunjukkan adanya korelasi yang tinggi antara subtes-subtes yang mengukur trait yang sama, dan validitas diskriminan ditunjukkan adanya korelasi yang rendah antara subtes-subtes yang mengukur trait yang berbeda (Azwar, 2007).

IST sendiri pada awalnya disusun oleh Amthauer sebagai baterai tes yang terdiri dari 9 sub tes, dan masing-masing subtes ini mengukur kemampuan-kemampuan spesifik inteligensi individu. Karakteristik dari baterai tes amthauer


(46)

menunjukan adanya suatu interkorelasi yang rendah antar subtesnya (r=0.25). (Diktat kuliah IST Universitas Padjajaran, 2008). Artinya bahwa masing-masing subtes dalam IST ini tidak boleh memiliki korelasi yang tinggi satu sama lain atau dengan kata lain tidak boleh saling konvergen antara satu subtes dengan subtes yang lainnya.

Dalam prosedurnya skor subjek pada subtes WA dikorelasikan dengan skor subjek pada delapan subtes IST lainnya, yakni: Satzergaenzung (SE),

Analogien (AN), Gemeinsamkeiten (GE), Rechenaufgaben (RA), Zahlenreinhen

(ZR), Figurenauswahl (FA), Wuerfelaufgaben (WU) dan Merkaufgaben (ME). Sebelum skor subjek pada subtes WA dikorelasikan dengan skor subjek pada delapan subtes lainnya, terlebih dahulu skor subjek pada semua subtes ditransformasikan ke dalam Z-score (bilangan baku). Hal ini bertujuan untuk menyetarakan metrik, dimana memang salah satu subtes yaitu GE yang diberi skor 0,1 dan 2 memiliki jarak metrik yang berbeda dengan 8 subtes lainnya yang diberi skor 0 dan 1. Untuk nilai Z-score masing-masing subtes dapat dilihat pada Lampiran III.

Langkah selanjutnya, nilai Z-score masing-masing subtes dikorelasikan dengan metode korelasi pearson product moment menggunakan bantuan program SPSS 16. Nilai korelasi ini lah yang nantinya menjadi koefisien validitas konstrak masing-masing subtes. Berikut merupakan matriks validasi multitrait multimethod antar subtes hasil korelasi yang ditunjukkan pada Tabel 10.


(47)

Tabel 10 Matriks validasi multitrait-multimethod subtes pada IST

SE WA AN GE RA ZR FA WU ME

SE 0.552 0.676 0.494 0.544 0.544 0.379 0.444 0.635 WA 0.579 0.524 0.548 0.546 0.379 0.384 0.540

AN 0.509 0.604 0.604 0.410 0.434 0.597

GE 0.492 0.490 0.348 0.274 0.466

RA 0.999 0.437 0.417 0.519

ZR 0.436 0.417 0.518

FA 0.390 0.335

WU 0.456

ME

Matriks validasi pada Tabel 10 menunjukkan nilai validitas konstrak subtes WA melalui korelasinya dengan 8 subtes IST lainnya. Terlihat bahwa subtes WA berkorelasi sebesar 0.552 dengan SE. WA berkorelasi sebesar 0,579 dengan AN. WA berkorelasi sebesar 0,524 dengan GE. WA berkorelasi sebesar 0,544 dengan RA dan ZR. WA berkorelasi sebesar 0,379 dengan FA. WA berkorelasi sebesar 0,384 dengan WU. WA berkorelasi sebesar 0,540 dengan ME.


(48)

B. Pembahasan

Berdasarkan deskripsi hasil penelitian di atas, maka akan dibahas tentang karakteristik psikometri Subtes WA pada IST.

1. Analisis Indeks Kesulitan Aitem Subtes WA

Berdasarkan hasil analisis indeks kesulitan aitem pada Tabel 4 diketahui bahwa variasi kesulitan masing-masing aitem pada subtes WA tersebut berada pada kategori mudah dan sedang. Sesuai dengan hasil analisis indeks kesulitan aitem subtes WA, terdapat 11 aitem (55%) dengan kesulitan sedang (0.30<p<0.7) yaitu aitem 21, 29, 31, 32, 33, 34, 35, 36, 37, 38, 39; dan sembilan aitem (45%) dengan kesulitan mudah (p>0.70) yaitu aitem 22, 23, 24, 25, 26, 27, 28, 30, 40.

Harga p yang berada pada titik ekstrem (terlalu sulit atau terlalu mudah) akan mempunyai daya diskriminasi yang kurang baik. Oleh karena itu, umumnya pada penyusunan instrumen tes disarankan untuk menggunakan aitem dengan taraf kesulitan sedang (0,50). Namun Lord (dalam Murphy & Davidshofer, 2003) menyatakan bahwa untuk tes seleksi karyawan, p akan dikatakan baik jika nilai p di bawah 0.30 (aitem sulit).

IST pada khususnya subtes WA merupakan tes inteligensi. Suatu tes inteligensi yang baik seharusnya memiliki variasi tingkat kesulitan aitem mulai dari tingkat kesulitan tinggi, sedang dan rendah (Murphy& Davidshofer, 2003). Pada Tabel 5, terlihat bahwa tidak ada satu pun aitem yang memiliki indeks kesulitan kategori tinggi. Hal ini menunjukkan bahwa subtes WA ini sudah tidak bagus digunakan sebagai salah satu tes inteligensi.

.


(49)

2. Analisis Indeks Daya Diskriminasi Aitem Subtes WA

Berdasarkan hasil analisis indeks daya diskriminasi dengan metode

extreme group pada Tabel 5 menunjukkan bahwa 10 aitem memiliki daya diskriminasi sangat bagus yaitu memiliki indeks daya diskriminasi d ≥ 0.40, 6

aitem memiliki daya diskriminasi Lumayan Bagus, yaitu memiliki indeks daya diskriminasi 0,30 – 0,39 dan 4 aitem membutuhkan revisi yaitu aitem yang memiliki nilai indeks daya diskriminasi d < 0,20. Hal ini berarti bahwa 10 aitem mampu membedakan antara Kelompok Tinggi dan Kelompok Rendah dengan sangat bagus, 6 lainnya lumayan bagus, tapi masih perlu peningkatan, sedangkan 4 aitem lainnya masih harus direvisi.

Berdasarkan hasil analisis indeks diskriminasi aitem dengan metode korelasi aitem-total pada Tabel 6 diketahui bahwa terdapat 6 aitem yang dinilai sangat bagus. Masing-masing aitem ini memiliki nilai indeks diskriminasi aitem di atas 0,4. Angka ini mengindikasikan bahwa aitem-aitem ini memiliki kualitas sangat baik dan memiliki kesesuaian fungsi dengan subtes dalam membedakan individu yang memiliki level kompetensi yang diharapkan dan individu yang tidak memilikinya. Dengan kata lain aitem-aitem ini memiliki fungsi yang sama dengan fungsi tes.

Selain itu ada 10 aitem yang dinilai lumayan baik dan tidak memerlukan revisi. Aitem-aitem tersebut memiliki nilai indeks diskriminasi aitem antara 0,3 sampai 0.39. Sementara 4 aitem lainnya dinilai belum memuaskan dan masih perlu direvisi. Aitem-aitem tersebut memiliki nilai indeks diskriminasi aitem antara 0,2 sampai 0,3.


(50)

Jika dilihat secara keseluruhan, baik dengan mengguunakan metode

extreme group maupun dengan metode korelasi aitem-total, dapat dikatakan

bahwa ada 16 butir aitem yang memiliki kualitas baik dan bisa diterima. Sementara itu, ada 4 aitem yang sebenarnya memiliki kualitas buruk. Aitem-aitem ini memiliki nilai indeks diskriminasi relatif rendah, yaitu di bawah 0,3. Hal ini mengindikasikan bahwa aitem-aitem ini tidak mampu menangkap perbedaan antara individu yang memiliki kompetensi yang diharapkan dan individu yang tidak memilikinya. Ke empat aitem tersebut masih mungkin untuk diterima asalkan aitem tersebut direvisi sesuai dengan batasan ukur aitem tersebut.

3. Analisis Efektivitas Distraktor Subtes WA

Efektivits distraktor-distraktor pada suatu aitem dianalisis dari distribusi jawaban terhadap aitem yang bersangkutan pada setiap alternatif yang disediakan. Efektivitas distraktor dilihat dari dua kriteria, yaitu: (a) distraktor dipilih oleh siswa dari Kelompok Rendah, dan (b) pemilih distraktor tersebar relative proporsional pada masing-masing distrakktor yang ada (Azwar, 2005)

Dengan menggunakan bantuan program iteman, efektivitas distraktor dilihat dari nilai point biserial, dimana sebuah aitem dikatakan memiliki distraktor yang efektif apabila alternatif yang menjadi kunci jawaban dipilih lebih banyak dari subjek Kelompok Tinggi (rpbis positif), serta alternative pengecoh lainnya dipilih lebih banyak dari Kelompok Rendah (rpbis negatif).

Pada Tabel 8 dapat dilihat bahwa terdapat 17 dari 20 aitem memiliki distraktor yang efektif, sementara 3 lainnya memiliki distraktor yang tidak efektif.


(51)

Ketiga aitem tersebut adalah aitem nomor 32, 38 dan 40. Pada aitem 32, distraktor E dipilih lebih banyak subjek Kelompok Tinggi (rpbis positif), padahal seharusnya sebuah distraktor lebih banyak dipilih subjek dari Kelompok Rendah. Pada aitem 38 dan 40, distraktor A tidak efektif, dimana distraktor ini juga lebih banyak dipilih dari Kelompok Tinggi.

4. Seleksi Aitem Berdasarkan Indeks Kesulitan Aitem, Indeks Daya Diskriminasi Aitem dan Efektivitas Distraktor

Proses analisis ini mencoba melihat aitem-aitem yang baik yaitu aitem yang memiliki parameter indeks daya diskriminasi yang bagus dan distraktor yang efektif. Indeks kesulitan aitem tidak dijadikan sebagai patokan karena taraf kesulitan aitem yang bervariasi memang dibutuhkan ada pada suatu tes inteligensi.

Berdasarkan hasil analisis seleksi yang dilakukan sesuai dengan ketentuan sebagai berikut:

a. Diterima jika: d ≥ 0.30 (Cukup bagus dan bagus sekali) semua distraktor efektif

b. Revisi jika: 0.20 ≤ d < 0.30 dan distraktor efektif d ≥ 0.30 dan distraktor tidak efektif c. gugur jika: : d < 0.2 V 0.20 ≤ d < 0.30

distraktor tidak efektif,

diperoleh hasil bahwa dari 20 butir aitem subtes WA, 14 aitem dapat diterima, 5 aitem memerlukan revisi dan 1 diantaranya gugur.


(52)

5. Indeks Reliabilitas Subtes WA

Berdasarkan hasil analisis diketahui bahwa nilai koefisien reliabilitas instrument subtes WA pada IST sebesar α = 0.650. Hal ini berarti variasi yang tampak pada skor tes dengan menggunakan instrument tersebut hanya mampu mencerminkan 65% dari variasi yang terjadi pada skor murni subjek yang bersangkutan. Dengan kata lain, 35% variasi skor yang tampak disebabkan oleh eror atau kesalahan.

Menurut Anastasi & Urbina (1997), suatu pengukuran dapat dikatakan reliabel apabila memiliki rentang nilai koefisien reliabilitas antara 0.80-0.90. sedangkan menurut Nunnally (2005), pengukuran dapat dikatakan reliabel jika memiliki koefisien reliabilitas diatas 0.70. Murphy & Davidshofer (2003) mengelompokkan nilai koefisien reliabilitas ke dalam beberapa kelompok nilai, yaitu nilai yang tidak dapat diterima (≤ 0.60), nilai yang rendah (0.61-0.70), nilai moderat (0.71-0.89) dan nilai yang tinggi (≥ 0.90).

Berdasarkan penjelasan tersebut, maka indeks reliabilitas subtes WA yang

memiliki nilai sebesar α = 0.650, masih tergolong nilai yang rendah dan belum memuaskan.

6. Analisis Validitas Konstrak Subtes WA

Berdasarkan validasi multitrait-multimethod yang terdapat pada Tabel 11, dapat dilihat validitas konstrak IST, khusunya subtes WA. Terlihat bahwa korelasi antara subtes WA dengan kedelapan subtes lainnya berada di atas 0.25. Hal ini berarti bahwa subtes WA sudah tidak sesuai lagi dengan tujuan awal Amthauer


(53)

ketika mengkonstraknya. Amthauer menyusun IST sebagai baterai tes yang terdiri dari 9 sub tes. Karakteristik dari baterai tes amthauer menunjukan adanya suatu interkorelasi yang rendah antar subtesnya (r=0.25) (Diktat kuliah IST Universitas Padjajaran, 2008).

Hasil korelasi antara subtes WA dengan kedelapan subtes IST lainnya yang jauh lebih besar dari apa yang seharusnya (0.25) menunjukkan bahwa adanya tumpang tindih mengenai trai-trait yang diukur oleh subtes WA dengan subtes lainnya. Artinya apa yang diukur oleh WA dapat juga terukur oleh subtes lainnya. Selain itu juga, hal ini kemungkinan diakibatkan adanya prroses pembelajaran pada subjek mengenai subtes-subtes yang terdapat dalam IST, mengingat banyaknya alat tes yang mirip dengan IST dijual di pasaran. Sehingga ketika IST ini diujikan pada subjek, maka yang terukur bukan lagi trait yang diharapkan, karena respon subjek merupakan hasil dari persiapan dan pembelajaran yang dilakukan oleh subjek sebelum mengikuti tes.

Lebih jauh lagi dapat kita lihat pada korelasi subtes WA dengan subtes AN, GE, RA, ZR dan ME yang rata-rata berada di atas 0.50. Menurut Guilford (1978), nilai korelasi r diatas 0.50 tergolong ke dalam korelasi yang lumayan tinggi (moderate). Interkorelasi yang cukup signifikan antara WA dengan subtes-subtes mungkin disebabkan adanya persamaan konstrak yang diukur, misalnya dengan RA dan ZR. Walaupun dilihat dari bentuk soal, WA sangat berbeda dengan kedua subtes ini, namun pada dasarnya kketiga subtes ini mengukur kemampuan berpikir induktif, dimana WA mengukur kemampuan berpikir induktif dengan bahasa, sedangkan RA dan ZR berpikir induktif dengan angka.


(54)

Demikian juga nilai korelasi antara WA dengan SE, AN, GE dan ME yang cukup signifikan. Hal ini mengindikasikan bahwa konstrak yang diukur dalam subtes WA terukur juga oleh subtes SE, AN, GE dan ME. Subtes-subtes ini juga sama-sama membutuhkan pemahaman bahasa untuk membuat keputusan dalam penyelesaian soal.

Selanjutnya subtes WA berkorelasi dengan FA sebesar 0.379 dan WA berkorelasi dengan WU sebesar 0.384. Menurut Guilford (1978), nilai yang berada diantara 0.20 sampai dengan 0.40 tergolong rendah. Meskipun nilai ini masih lebih besar dari nilai interkorelasi yang ditentukan oleh Amtheuer, namun korelasi yang terjadi tergolong rendah. Artinya memang subtes WA mengukur konstrak yang berbeda dengan WU dan FA, dimana WU mengukur daya bayang ruang dan FA mengukur daya konstraksi.

Jika dilihat dari nilai validitas dan reliabilitas subtes WA, maka nilai validitas subtes WA masih dapat diterima. Azwar (2002) menyatakan bahwa nilai korelasi antara skor suatu tes dengan tes lain tidak dapat lebih tinggi daripada korelasi antara skor tes itu dengan skor murninya sendiri. Artinya nilai validitas alat tes tidak boleh melebihi nilai reliabilitasnya. Subtes WA memiliki nilai reliabilitas sebesar 0.650, dan nilai korelasi subtes WA dengan delapan subtes lainnya tidak ada yang sama atau melebihi 0.650. Namun karena adanya nilai validitas konvergen yang tinggi antara subtes WA dengan delapan subtes IST lainnya, yang mana hal ini seharusnya tidak boleh terjadi, maka secara keseluruhan dapat disimpulkan bahwa IST khususnya subtes WA sudah tidak valid digunakan.


(55)

BAB V

KESIMPULAN DAN SARAN

A. Kesimpulan

Berdasarkan hasil penelitian tentang karakteristik psikometri subtes WA pada IST, maka dapat ditarik beberapa kesimpulan sebagai berikut:

1. Secara umum, indeks kesulitan aitem subtes WA masih belum memuaskan. Mengingat bahwa subtes WA pada IST merupakan alat tes inteligensi maka diharapkan aitem-aitemnya harus memiliki indeks kesulitan yang bervariasi dari mudah, sedang sampai dengan sulit. Berdasarkan hasil analisis, tidak ada satupun aitem yang memiliki taraf kesulitan yang tinggi.

2. Berdasarkan hasil analisis indeks daya diskriminasi aitem subtes WA, aitem-aitem yang memiliki kualitas yang baik serta mampu menangkap perbedaan individu yang memiliki tingkat kompetensi baik dan tidak baik berjumlah 16 aitem. Ke 16 aitem ini memiliki indeks daya diskriminasi sangat bagus dan lumayan bagus, sehingga tidak membutuhkan revisi.

3. Berdasarkan hasil analisis efektifitas distraktor pada aitem subtes WA, 17 dari 20 aitem memiliki distraktor yang efektif, dalam arti distraktor tersebut berfungsi sebagaimana mestinya.

4. Secara keseluruhan dari hasil analisis gabungan karakteristik psikometri yang dilakukan terhadap subtes WA menunjukkan bahwa 14 aitem dapat diterima, 5 aitem membutuhkan revisi dan 1 sisanya dianggap gugur.

5. Instrumen subtes WA pada IST yang mengukur kemampuan berpikir induktif dengan bahasa dalam proses seleksi karyawan masih tidak reliabel.


(56)

6. Berdasarkan analisis validitas konstrak Subtes WA pada IST diketahui bahwa subtes ini sudah tidak valid.

B. Saran

Berdasarkan hasil penelitian tentang karakteristik psikometri subtes WA pada IST, maka disarankan beberapa hal yang berkaitan dengan penggunaan subtes WA pada masa yang akan datang, sebagai berikut:

1. Jika dilihat dari hasil analisis aitem subtes WA, maka diharapkan adanya perbaikan terhadap beberapa aitem dengan memperhatikan tingkat kesulitan, indeks daya diskriminasi serta distraktor yang digunakan.

2. Untuk peneliti selanjutnya, disarankan untuk mengkorelasikan dengan alat tes lain diluar IST, misalnya dengan TIKI atau CFIT, supaya hasil yang diperoleh lebih kaya dan mendalam khususnya mengenai validitas diskriminan.

3. Selain itu, peneliti selanjutnya juga diharapkan untuk meneliti secara kualitatif, karena dalam penelitian ini, peneliti masih terfokus secara kuantitatif.

4. Untuk para tenaga akademisi, khususnya bidang psikometri Fakultas Psikologi Universitas Sumatera Utara, supaya mempertimbangkan melakukan revisi dan adaptasi terhadap IST supaya menjadi alat tes yang valid dan reliabel di lingkungan Fakultas Psikologi.

5. Untuk P3M diharapkan untuk lebih memperhatikan kunci jawaban, karena selama dalam proses penelitian ini, dijumpai ketidaksesuaian kunci jawaban IST versi P3M dengan IST UNPAD, khususnya pada subtes WA dijumpai 4 kunci yang tidak sesuai, yaitu aitem 23, 35, 38 dan 40.


(57)

6. Selain itu, P3M juga diharapkan agar hati-hati saat memeriksa setiap lembar jawaban peserta tes, karena selama dalam proses penelitian ini juga dijumpai beberapa lembar jawaban yang salah koreksi. Tentu hal ini dapat merugikan peserta tes.


(58)

BAB II

TINJAUAN PUSTAKA

Menurut Azwar (2007) bahwa teori pengukuran dapat dibahas dari tiga macam pendekatan secara umum, yaitu (a) pendekatan teori skor murni klasikal (classical score theory), (b) pendekatan teori skor murni kuat (strong

true-score theory) dan (c) pendekatan latent-trait theory.

Teori murni kuat mempunyai pandangan yang mirip dengan teori skor-murni klasikal mengenai nilai harapan skor tampak yang merupakan skor skor-murni, akan tetapi dalam teori skor murni kuat terdapat asumsi-asumsi tambahan mengenai probabilitas skor-tampak yang akan diperoleh seorang subjek yang merupakan skor-murni tertentu sehingga dengan asumsi-asumsi tersebut kelayakan teori skor-murni kuat bagi data tertentu, dapat diuji.

Sedangkan latent-trait theory berasumsi bahwa aspek performansi terpenting pada suatu tes dapat ditunjukkan oleh kedudukan seorang subjek pada suatu latent-trait yang berupa karakteristik psikologis yang tidak tampak. Berbeda dengan teori skor murni kuat, walaupun asumsi bahwa nilai harapan skor tampak pada teori latent-trait juga merupakan skor murni, pada umumnya tidak terdapat hubungan linear antara skor-murni dengan latent-trait sehingga nilai harapan skor tampak tidak sama dengan nilai latent-trait.

Teori skor murni kuat dan teori latent-trait tidak cuma sekedar membahas konsep eror standar dalam pengukuran saja, akan tetapi juga membahas masalah


(59)

eror standar yang bervariasi sesuai dengan level skor murni atau latent-traitnya. Menurut kedua teori tersebut, eror standar tidak terpengaruh oleh distribusi skor subjek.

Penelitian ini akan menggunakan pendekatan pendekatan teori skor murni klasikal dalam proses analisis yang dilakukan, denga pertimbangan bahwa teori ini lebih praktis dalam menerangkan masalah reliabilitas dan validitas. Selain itu juga pemahamannya yang tidak menuntut pengetahuan yang terlalu dalam mengenai beberapa fungsi distribusi statistik dan model-model matematiknya.

E. Classical True-score Theory

1. Pengertian Classical True-score Theory

Classical True-score Theory (selanjutnya disebut dengan CTT) merupakan

pendekatan yang telah berhasil meletakkan dasar-dasar konsepsi reliabilitas pada dekade-dekade yang telah lalu dan memiliki kontribusi yang sangat besar dalam pengembangan formula-formula reliabilitas. Pendekatan ini juga memiliki nilai praktis yang tinggi dalam menerangkan masalah validitas dan reliabilitas (Azwar, 2004)

CTT pada intinya dijelaskan dalam bentuk asumsi-asumsi matematis, yang pada akhirnya dijadikan sebagai dasar turunan aljabar atau kesimpulan-kesimpulannya.


(60)

2. Asumsi-asumsi dalam Classical True-score Theory

Sebelum membahas asumsi-asumsi dalam CTT, perlu diketahui bahwa asumsi-asumsi tersebut merupakan hubungan matematis dari skor tampak (X), skor murni (T), dan eror pengukuran (E). Skor tampak merupakan angka yang menunjukkan nilai performansi subjek pada suatu pengukuran, yang tidak lain merupakan nilai total dari jawaban subjek dalam tes tersebut. Skor murni dijelaskan sebagai angka performansi.

Adapun sumsi-asumsi dalam CTT (dalam Azwar, 2007) adalah sebagai berikut: Asumsi 1 :

X = T + E (1)

Asumsi ini menjelaskan bahwa sifat aditif berlaku pada hubungan antara skor tampak, skor muni, dan eror. Skor tampak (X) merupakan jumlah skor murni (T) dan eror (E)

Asumsi 2:

ε(X) = T (2)

Asumsi ini menyatakan bahwa skor murni merupakan nilai harapan dari skor tampaknya. Jadi, T merupakan harga rata-rata distribusi teoretik skor tampak apabila orang yang sama dikenai tes yang sama berulangkali dengan asumsi pengulangan tes itu dilakukan tidak terbatas banyaknya dan setiap pengulangan tes adalah independen satu sama lain.

Asumsi 3:

= 0 (3)


(61)

Asumsi ini menyatakan bahwa bagi populasi subjek yang dikenai tes, distribusi eror pengukuran dan distribusi skor murni tidak berkorelasi. Implikasinya, skor murni yang tinggi tidak selalu berarti mengandung eror yang selalu positif ataupun selalu negatif (Azwar, 2007).

Asumsi 4:

= 0 (4)

Asumsi ini menyatakan bahwa dalam eror pada dua tes ( yang dimaksud untuk mengukur hal yang sama) tidak saling berkorelasi. Asumsi ini akan tidak terpenuhi sekiranya skor tampak dipengaruhi kondisi testing, seperti misalnya kelelahan, Practice effect, suasana hati, atau factor-faktor dari lingkungan (Suryabrata, 2005).

Asumsi 5 :

= 0 (5)

Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama, maka eror pada tes pertama tidak berkorelasi dengan skor-skor murni pada tes kedua.

Asumsi 6

Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama

membunyai skot tampak X dan X’ yang memenuhi asumsi 1 sampai 5, dan jika untuk setiap populasi subjek T = T’ serta varians eror kedua tes tersebut sama,


(62)

Asumsi 7

Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama

membunyai skot tampak X dan X’ yang memenuhi asumsi 1 sampai 5, dan jika

untuk setiap populasi subjek T1 = T2 + C. Dengan C sebagai suatu bilangan konstan, maka kedua tes tersebut dapat disebut sebagai tes yang setara (equivalent

test).

B. Analisis Karakteristik Psikometri

Sebuah instrument tes merupakan sekumpulan aitem yang disusun sedemikian rupa, baik berupa pertanyaan maupun pernyataan mengenai suatu hal yang hendak diukur (Azwar, 2007). Proses analisis terhadap karakteristik psikometri dari suatu instrument tes ditujukan untuk memilih aitem-aitem yang layak dan mengetahui kelayakan instrument tersebut. Jadi proses analisis dapat dilakukan untuk merancang sebuah instrumen tes yang baru atau menguji instrument yang sudah ada. Proses analisis tersebut secara sederhana meliputi dua cara, yaitu:

Tahap Pertama adalah analisis dan seleksi aitem berdasarkan evaluasi

secara kualitatif. Evaluasi ini bertujuan untuk melihat apakah aitem yang ditulis sudah sesuai dengan blue-print dan indikator perilaku yang hendak diungkap, melihat apakah aitem telah ditulis sesuai dengan kaidah penulisan yang benar, dan melihat apakah aitem-aitem yang ditulis masih mengandung social desirability yang tinggi. Evaluasi secara kualitatif ini dikerjakan oleh suatu panel ahli.


(63)

Tahap kedua adalah prosedur seleksi aitem berdasarkan data empiris

dengan melakukan analisis kuantitatif terhadap parameter-parameter aitem. Parameter-parameter yang dimaksud meliputi indeks diskriminasi aitem dan indeks kesulitan aitem, analisis efektivitas distraktor, analisis reliabilitas, serta analisis validitas dari instrumen tersebut (Crocker & Algina, 2005).

1. Indeks Kesulitan Aitem

a. Pengertian Indeks Kesulitan Aitem

Indeks kesulitan aitem yang biasanya disimbolkan dengan huruf p merupakan rasio antara penjawab aitem dengan benar dan banyaknya penjawab aitem. Secara teoritik dikatakan bahwa p sebenarnya merupakan probabilitas empirik untuk lulus aitem tertentu bagi kelompok subjek tertentu. Secara matematis diformulaikan sebagai berikut:

p = ni / N (6)

Keterangan:

p = indeks kesulitan aitem

ni = banyaknya subjek yang menjawab aitem dengan benar

N = banyaknya subjek yang menjawab aitem

Selain untuk membedakan subjek yang menguasai suatu pelajaran dengan baik dengan yang tidak menguasai dengan baik, indeks kesulitan aitem juga berfungsi dalam hal penyusunan aitem-aitem saat penyusunan alat tes. Hal ini sesuai dengan apa yang diungkapkan oleh Kumar (2009), yang menyatakan bahwa penyusunan aitem dilakukan berdasarkan nilai indeks kesulitan aitem. Lebih lanjut Murphy & Davidshofer (2003) menyarankan untuk menyusun


(64)

aitem-aitem dalam tes secara sistematis, dengan menempatkan aitem-aitem-aitem-aitem berdasarkan tingkat kesukarannya, mulai dari aitem yang paling mudah hingga yang paling sulit. Sehingga pola penyusunan aitem-aitem dalam tes dimulai dari aitem dengan harga p yang paling tinggi hingga aitem dengan harga p yang paling rendah. b. Analisis Indeks Kesulitan Aitem

Nilai p yang semakin tinggi menunjukkan bahwa aitem yang bersangkutan semakin mudah. Nilai p berkisar dari 0 sampai dengan angka 1. Apabila sebuah aitem sedemikian sukarnya, sehingga tidak seorang subjek pun dapat menjawab dengan benar, maka harga p = 0, sedangkan apabila suatu aitem sedemikian mudahnya sehingga seluruh subjek dapat menjawab dengan benar, maka harga p = 1. Aitem yang terlalu mudah atau terlalu sulit biasanya tidak akan banyak berguna dalam membedakan subjek yang menguasai bahan pelajaran dan mereka yang tidak (Azwar, 2007).

Pada umumnya harga p yang berada disekitar 0,50 dianggap yang terbaik. Menurut Azwar (2007), harga p terbaik adalah yang sesuai yang sesuai dengan tujuan tes yang bersangkutan. Misalnya kadang-kadang dikehendaki harga p < 0,50 (aitemnya lebih sulit) apabila aitem aitem itu dimaksudkan sebagai bagian dari suatu tes yang digunakan dalam prosedur seleksi guna memilih sebagian kecil saja dari antara pelamar. Tidak jarang pula sebuah tes prestasi perlu disusun dengan memasukkan banyak aitem yang taraf kesulitannya rendah (p tinggi) dengan tujuan untuk evaluasi formatif.

Jadi bisa dikatakan bahwa harga p yang berada pada titik ekstrem (terlalu sulit atau terlalu mudah) akan mempunyai daya diskriminasi yang kurang baik.


(65)

Oleh karena itu, umumnya pada penyusunan instrumen tes disarankan untuk menggunakan aitem dengan taraf kesulitan sedang (0,50). Namun Lord (dalam Murphy & Davidshofer, 2003) menyatakan bahwa untuk tes seleksi karyawan, p akan dikatakan baik jika nilai p mendekati 0,2.

Allen & Yen (dalam Lababa, 2008) mengkategorikan nilai p sebagai berikut:

Tabel 1 Kategori Tingkat Kesulitan aitem

No P Kategori

1 p<0,3 Sulit

2 0,3 p 0,7 Sedang

3 p>0,7 Mudah

Ada beberapa hal yang perlu dipahami mengenai indeks kesulitan aitem ini, diantaranya pertama adalah bahwa harga p dari suatu aitem menunjukkan taraf kesulitan aitem tersebut bagi kelompok yang bersangkutan, yaitu kelompok yang menjadi dasar dalam menghitung p itu sendiri (Azwar, 2005). Artinya harga p suatu aitem akan berbeda apabila dihitung pada kelompok siswa yang berbeda.

Kedua bahwa besarnya harga p yang kita hitung merupakan indek kesulitan aitem

bagi seluruh kelompok yang bersangkutan, bukan indeks kesulitan bagi masing-masing individu dalam kelompok. Artinya harga p yang dihitung dalam kelompok hanya merupakan rata-rata indeks kesulitan bagi seluruh individu dalam kelompok tersebut.

Berdasarkan penjelasan di atas, maka dalam penelitian ini aitem dikatakan memiliki indeks diskriminasi yang baik jika harga p lebih kecil dari 0,3, dengan alasan bahwa IST dalam hal ini digunakan untuk seleksi karyawan, yaitu memilih sebagian kecil saja dari antara para pelamar.


(66)

2. Indeks Daya Diskriminasi Aitem a. Pengertian Indeks Diskriminasi Aitem.

Indeks daya diskriminasi aitem atau sering disebut dengan daya beda aitem merupakan parameter yang paling penting dalam tes psikologi yang menunjukkan sejauh mana aitem mampu membedakan antara individu atau kelompok individu yang memiliki dan yang tidak memiliki atribut yang diukur (Azwar, 2005). Artinya bahwa aitem yang memiliki daya beda yang tinggi harus memiliki skor yang tinggi pada individu yang memiliki atribut yang diukur dan skor yang rendah pada individu yang tidak memiliki atribut yang diukur.

Indeks diskriminasi aitem (d) secara sederhana didefinisikan sebagai perbedaan proporsi penjawab aitem dengan benar antara Kelompok Tinggi dengan Kelompok Rendah.

Secara matematis diformulasikan sebagai berikut:

(7)

Keterangan:

d : Indeks diskriminasi Aitem

niT : jumlah subjek penjawab dengan benar dari Kelompok Tinggi nT : Jumlah subjek Kelompok Tinggi

niR : jumlah subjek penjawab dengan benar dari Kelompok Rendah nR : Jumlah subjek Kelompok Rendah

Formulasi di atas sama dengan perbedaan/ selisih indeks kesulitan pada Kelompok Tinggi dan Kelompok Rendah, sehingga lebih sederhana dapat diformulasikan sebagai berikut:


(1)

DAFTAR ISI

ABSTRAK ... i

KATA PENGANTAR ... ii

DAFTAR ISI ... iii

DAFTAR TABEL... iv

DAFTAR RUMUS... v

DAFTAR LAMPIRAN... vi

BAB I PENDAHULUAN A. Latar Belakang ... 1

B. Perumusan Masalah ... 9

C. Tujuan Penelitian ... 10

D. Manfaat Penelitian ... 11

E. Sistematika Penelitian... 12

BAB II TINJAUAN PUSTAKA A. Classical True-score Theory ……………. 13

1. Pengertian Classical True-score Theory ………. 13

2. Asumsi-asumsi dalam Classical True-score Theory …… 13

B. Analisis Karakteristik Psikometri ……….…. 15

1. Indeks Kesulitan Aitem ………. 16

a. Pengertian Indeks Kesulitan Aitem ………. 16

b. Analisis Indeks Kesulitan Aitem ………. 17

2. Indeks Diskriminasi Aitem ……….. 19


(2)

b. Analisis Indeks Diskriminasi Aitem ……….. 21

3. Efektivitas Distraktor……… 24

4. Reliabilitas ……… 25

a. Pengertian Reliabilitas ……… 25

b. Jenis-jenis Pendekatan Estimasi Reliabilitas………… 27

c. Analisis Koefisien Reliabilitas……….. 37

d. Interpretasi Koefisien Reliabilitas ……… 38

e. Faktor-faktor yang Mempengaruhi Reliabilitas ……… 40

5. Validitas ………. 41

a. Pengertian Validitas ……….. 41

b. Jenis-jenis Validitas………. 43

6. Hubungan Karakteristik Psikometri……… 46

C. Intelligenz Structure Test (IST)……… 47

D. Subtes Wortauswahl (WA)……… 51

a. Inductive Reasoning……….. 53

b. Categorization……… 54

c. Skoring dan Interpretasi WA………. 55

BAB III METODE PENELITIAN A. Jenis Penelitian……….. 57

B. Metode Pengumpulan Data ……… 57

C. Data Penelitian……….. 58


(3)

F. Analisis Data……….. 61 BAB IV HASIL DAN PEMBAHASAN

A. Deskripsi Hasil

1. Analisis Indeks Kesulitan Aitem Subtes WA

2. Analisis Indeks Daya Diskriminasi Aitem Subtes WA. 3. Analisis Efektivitas Distraktor Subtes WA.

4. Seleksi Aitem Berdasarkan Indeks Kesulitan Aitem, Indeks Daya Diskriminasi Aitem dan Efektivitas Distraktor

5. Indeks Reliabilitas Subtes WA

6. Analisis Validitas Konstrak Subtes WA B. Pembahasan

1. Analisis Indeks Kesulitan Aitem Subtes WA

2. Analisis Indeks Daya Diskriminasi Aitem Subtes WA. 3. Analisis Efektivitas Distraktor Subtes WA.

4. Seleksi Aitem Berdasarkan Indeks Kesulitan Aitem, Indeks Daya Diskriminasi Aitem dan Efektivitas Distraktor

5. Indeks Reliabilitas Subtes WA

6. Analisis Validitas Konstrak Subtes WA BAB V KESIMPULAN DAN SARAN

1. Kesimpulan 2. Saran


(4)

DAFTAR TABEL

Halaman Tabel 1 Kategori Tingkat Kesulitan Aitem

Tabel 2 Evaluasi Indeks Daya Diskriminasi Aitem Tabel 3 Indeks kesulitan aitem subtes WA

Tabel 4 Analisis aitem berdasarkan nila p

Tabel 5 Indeks Daya Diskriminasi Aitem Subtes WA dengan metode extreme group

Tabel 6 Hasil Analisis Indeks Daya Diskriminasi Aitem Subtes WA dengan bantuan program Iteman.

Tabel 7 Analisis aitem berdasarkan nilai d Tabel 8 Efektivitas Distraktor Subtes WA

Tabel 10 Seleksi Aitem Berdasarkan Indeks Kesulitan Aitem, Indeks Daya Diskriminasi Aitem dan Efektivitas Distraktor


(5)

DAFTAR FORMULA

Formula 1 Asumsi 1 CTT

Formula 2 Asumsi 2 CTT Formula 3 Asumsi 3 CTT Formula 4 Asumsi 4 CTT Formula 5 Asumsi 5 CTT

Formula 6 Indeks Kesulitan Aitem Formula 7 Indeks Diskriminasi Aitem

Formula 8 Bentuk sederhana dari formua Indeks Diskriminasi Aitem Formula 9 Formula Poin Biserial

Formula 10 Formula Sperman Brown Formula 11 Formula Rulon

Formula 12 Formula Koefisien Alpha untuk Tes Belah Dua

Formula 13 Formula Koefisien Alpha untuk Tes Belah Lebih dari Dua Belahan Formula 14 Formula Flanagan

Formula 15 Formula KR-20 Formula 16 Formula KR-21

Formula 17 Bentuk lain Formula KR-21

Formula 18 Formula untuk Tes Belah Tiga (Formula Kristof) Formula 19 Formula Reliabilitas Hoyt

Formula 20 Formula Feldt

Formula 21 Interpretasi 3 Koefisien Reliabilitas Formula 22 Interpretasi 4 Koefisien Reliabilitas Formula 23 Interpretasi 5 Koefisien Reliabilitas Formula 24 Interpretasi 6 Koefisien Reliabilitas Formula 25 Standard error Pengukuran


(6)

DAFTAR LAMPIRAN

Halaman Lampiran 1 DATA PENELITIAN

A. Tabulasi Respon Subjek terhadap Subtes WA pada IST

Lampiran 2 ANALISIS PARAMETER AITEM DENGAN PROGRAM ITEMAN

A. Menyimpan Data dalam Bentuk NotePad/Fixed ASCII B. Membuat Syntax (Control Tile)

C. Membuka Lembar Kerja ITEMAN D. Membaca Hasil Analisis Iteman

E. Output Analisis Aitem Subtes WAdengan Iteman Lampiran 3 OUTPUT ANALISIS KORELASI SUBTES RA

DENGAN 8 SUBTES LAINNYA PADA IST

DENGAN BANTUAN SPSS VERSI 16 A. Transformasi Z Skor Subjek Pada 9 Subtes IST. B. Output Validitas Konstrak Subtes WA