BAB II TINJAUAN PUSTAKA 1. Revisi Tes - Karakteristik Psikometri Subtes Rechenaufgaben (RA) Versi Revisi pada Intelligenz Struktur Test (IST

  (2000) mengungkapkan bahwa merubah isi tes seperti, perubahan tampilan

  

booklet, perubahan manual tes, menghapus aitem yang kurang baik,

  menambah aitem, mengganti aitem, ataupun mengembangkan norma baru dianggap sebagai perevisian sebuah tes. Beberapa tipe tes psikologi berkemungkinan berisi aitem yang ketinggalan zaman ataupun membutuhkan revisi yang lebih sering dibandingkan tes yang lain. Contohnya seperti tes inteligensi, tes prestasi, ataupun tes minat yang aitem-aitemnya berpatokan pada informasi yang berkembang di masa itu sehingga tentunya lebih sering membutuhkan revisi dibandingkan tes kepribadian yang kontennya lebih konstan sepanjang waktu (Butcher, 2000).

  Beberapa faktor yang mempengaruhi kapan sebuah tes perlu direvisi adalah keawetan konten tes dan popularitas tes (Murpy, 2003). Pertama, keawetan konten tes. Banyak tes berisi aitem-aitem yang perlu diperbarui terlebih dahulu agar tetap sesuai dengan perkembangan zaman. Apabila aitem tidak revisi, maka individu akan kesulitan dalam memberikan jawaban karena tidak memahami maksud aitem tersebut. Sehingga, merevisi aitem-aitem

  Kedua, popularitas tes. Tes yang populer cenderung menjadi subjek penelitian yang akhirnya memberikan informasi-informasi bermakna mengenai sebuah tes. Informasi tersebut dapat berupa evaluasi karakteristik psikometris, makna skor tes, ataupun generalisasi tes. Berdasarkan data-data yang diperoleh, penelitian-penelitian tersebut sering menyarankan untuk melakukan modifikasi konten, perubahan prosedur administrasi, ataupun perubahan skoring tes (Murphy, 2003).

  b.

Prosedur Revisi Tes

  Langkah-langkah dasar dalam penyusunan skala psikologi memberikan gambaran alur kerja umum mengenai prosedur yang bisa dilakukan untuk merevisi sebuah alat tes. Azwar (2010) membuat alur kerja penyusunan skala psikologi seperti ditampilkan dalam Gambar 1.

  Identifikasi Tujuan Ukur Menetapkan Konstrak Psikologis

  Operasionalisasi Aspek Indikator Perilaku

  Penskalaan Pemilihan Format Stimulus Penulisan Aitem

  Review Aitem Uji Coba Tahap

  Analisis Aitem dalam Proses Revisi

  Kompilasi I Seleksi Aitem

  Validasi Kompilasi II Format Final

  Gambar 1. Alur Kerja Penyusunan Skala Psikologi Proses penyusunan skala psikologi diawali dengan memilih suatu definisi dan mengenai teori yang mendasari konstrak psikologis atribut yang hendak diukur, atau disebut juga dengan identifikasi tujuan ukur. Setelah teridentifikasi, perlu dilakukan pembatasan domain ukur berdasarkan konstrak yang bersangkutan dengan menguraikan komponen atau dimensi yang ada dalam atribut tersebut. Lalu, komponen atau dimensi tersebut dioperasionalisasikan ke dalam bentuk indikator-indikator perilaku. Proses dilanjutkan dengan menentukan format stimulus yang akan digunakan dengan mempertimbangkan kelebihan teoritis dan manfaat praktis format yang hendak dipilih. Apabila indikator perilaku telah dirumuskan dengan benar lalu disajikan dalam bentuk blue-print. Dalam penelitian, keempat tahap tersebut tidak lagi dilakukan karena menggunakan aspek- aspek yang telah ada sebelumnya.

  Proses perevisian alat tes dalam penelitian ini dimulai dari tahap kelima, yaitu penulisan aitem. Peneliti menulis aitem-aitem yang perlu diubah ataupun diganti. Setiap aitem yang telah ditulis perlu diperiksa ulang oleh penulis aitem apakah aitem tersebut telah sesuai dengan indikator yang hendak diungkap dan sesuai pedoman penulisan aitem. Setelah seluruh aitem ditulis, aitem akan di-review oleh beberapa orang yang kompeten mengenai konstruksi skala dan masalah atribut yang diukur. Aitem-aitem yang tidak sesuai perlu diperbaiki atau ditulis ulang sehingga aitem-aitem yang diloloskan ke tahap uji coba hanyalah aitem-aitem yang diyakini akan berfungsi dengan baik.

  Kalimat-kalimat dalam aitem perlu diuji coba untuk melihat apakah aitem tersebut dapat dipahami dengan jelas oleh subjek seperti yang diinginkan oleh penulis aitem. Terkadang apa yang sudah jelas bagi penulis aitem mungkin saja tidak cukup jelas bagi para subjek. Uji coba ini juga dijadikan salah satu cara untuk memperoleh data respon yang akan digunakan untuk mengevaluasi kualitas aitem secara kuantitatif.

  Selanjutnya, akan dilakukan analisis aitem yang merupakan pengujian parameter-parameter aitem apakah sudah memenuhi persyaratan psikometris untuk dimasukkan ke dalam skala. Hasil analisis aitem ini akan dijadikan dasar dalam menseleksi aitem-aitem. Aitem-aitem yang tidak memenuhi persyaratan psikometris akan disingkirkan atau diperbaiki terlebih dahulu.

  Pengujian reliabilitas skala dilakukan terhadap aitem-aitem yang telah lolos yang jumlahnya disesuaikan dengan blue-print. Proses validasi umumnya merupakan proses yang berkelanjutan. Pada skala-skala yang akan digunakan secara terbatas biasanya dilakukan uji validitas kriteria sedangkan pada skala-skala yang akan digunakan secara luas biasnya dilakukan analisis faktor.

  Terakhir, format final skala harus disusun dengan tampilan yang menarik dan mudah untuk dibaca oleh subjek. Skala juga harus dilengkapi dengan petunjuk pengerjaan. Pemilihan huruf dan ukuran kertas juga harus dipertimbangkan agar membuat subjek nyaman dalam menjawab aitem- aitem.

  Pada penelitian ini, proses revisi aitem akan dimulai dari tahap penulisan aitem-aitem yang telah teridentifikasi perlu direvisi. Berdasarkan penelitian-penelitian sebelumnya ditemukan bahwa terdapat 17 dari 20 aitem yang ada di dalam subtes RA pada IST perlu direvisi, yaitu aitem nomor 77, 78, 80, 81, 82, 84, 85, 87, 88, 89, 90, 91, 92, 93, 94, 95, dan 96. Setelah aitem ditulis dan dievaluasi oleh professional judgement, maka aitem-aitem tersebut

  Apabila data telah diperoleh, aitem-aitem akan dianalisis mengenai persyaratan psikometerisnya. Jika belum memenuhi, maka aitem akan kembali ke tahap penulisan aitem hingga akhirnya memenuhi persyaratan psikometris seperti yang diinginkan oleh peneliti. Aitem-aitem yang telah lolos adalah aitem-aitem yang dimasukkan ke dalam format final skala.

Teori Respon Butir

  Pendekatan teori respon butir didasarkan pada sifat-sifat atau kemampuan laten yang mendasari respon subjek terhadap aitem tertentu.

  Teori respon butir, atau dikenal juga dengan latent trait theory, mengestimasi tingkat trait berdasarkan respon subjek serta karakteristik aitem yang diberikan (Embretson, 2000).

  Teori respon butir diperkenalkan oleh Lord dan Novick pada tahun 1968 dan mulai mendominasi dasar teoritis sebuah pengukuran. Hal ini dikarenakan teori respon butir memiliki prinsip pengukuran yang lebih seimbang secara teoritis dan mampu mengatasi masalah-masalah pengukuran dengan lebih baik. Prinsip-prinsip teori respon butir dapat digunakan untuk menseleksi aitem mana yang paling tepat diberikan untuk seorang subjek dan menghitung skor antar subset aitem yang berbeda (Embretson, 2000).

  Banyak model teori respon butir yang sudah dikembangkan untuk diaplikasikan pada berbagai bidang psikologi. Sehingga teori respon butir gangguan prilaku, sikap, dan trait kognitif seperti inteligensi (Embretson, 2000).

  1) Asumsi Teori Respon Butir

  Teori Respon Butir memiliki beberapa asumsi kunci, yaitu Kurva Karakteristik Aitem (KKA), independensi lokal, dan unidimensionalitas (Embretson, 2000).

  a) Kurva Karakteristik Aitem. Bentuk KKA menunjukkan bagaimana hubungan antara perubahan kemampuan subjek dan perubahan responnya terhadap aitem. Pada aitem dikotomi, yaitu sebuah respon tertentu akan dianggap benar, KKA meregresi kemungkinan kesuksesan suatu aitem pada tingkat kemampuan tertentu. Untuk aitem politomi, seperti skala rating, KKA meregresi kemungkinan respon masing-masing kategori pada tingkat kemampuan.

  b) Asumsi independensi lokal. Hal ini menyangkut tentang kecukupan model teori respon butir terhadap data. Independensi lokal diperoleh ketika hubungan antar aitem atau antar subjek dikarakteristikkan sepenuhnya oleh model teori respon butir. Independensi lokal juga dapat diperoleh ketika kemungkinan menyelesaikan suatu aitem tidak beketergantungan dengan aitem-aitem lainnya, adanya pengontrolan terhadap parameter subjek dan parameter aitem.

  c) Unidimensionalitas. Independensi lokal juga berhubungan dengan jumlah variabel trait yang mendasari aitem. Independensi lokal akan menunjukkan subjek hanya pada satu dimensi. Namun, independensi lokal juga bisa dicapai dengan data multidimensi jika masing-masing dimensi memiliki parameter subjek ataupun dengan data yang mana setiap aitem saling beketergantungan.

  2)

Model Teori Respon Butir

  Model teori respon butir dapat dikategorikan berdasarkan jumlah respon yang diskor, yaitu dikomotomi dan politomi. Pada model dikotomi, respon aitem diskor ke dalam dua kelompok yang menunjukkan sukses (1) atau gagal (2). Aitem pilihan berganda juga termasuk ke dalam model dikotomi karena walaupun memiliki banyak pilihan jawaban, namun jawaban tetap di skor sebagai benar atau salah (Embretson, 2000).

  Pada model politomi, sebuah aitem memiliki lebih dari dua pilihan respon jawaban. Masing-masing respon tersebut memiliki nilai skor yang berbeda-beda pula. Contohnya seperti aitem model Likert yang mana setiap pilihan jawaban di skor dari rentang 1 sampai 5 (Embretson, 2000).

  Teori respon butir memiliki 3 model fungsi distribusi logistik, yaitu model logistik 1 parameter, model logistik 2 parameter, dan model logistik 3 parameter (Naga, 1992). Perbedaan tiga model ini terletak pada jumlah parameter yang digunakan. Model paling sederhana dalam teori respon butir adalah model logistik 1 parameter yang juga dikenal sebagai model Rasch. Model Rasch hanya menggunakan parameter b atau kesulitan aitem untuk membedakan antar aitem. Variabel independen dalam model ini adalah trait adalah adalah respon dikotomi (sukses atau gagal, benar atau salah) dari orang tertentu tentang suatu aitem. Terdapat dua versi variabel dependen, yaitu log odds dan probability (Embretson, 2000).

  Pada log odds dalam Rasch model, odds menunjukkan rasio jumlah benar dengan jumlah berhasil (Embretson, 2000). Rasio ini terlihat dari perbedaan antara trait score s ) dengan tingkat i ).

  (Ө kesulitan aitem (β Sehingga rasio kemungkinan berhasil untuk subjek s pada aitem i, yaitu P is , terhadap kemungkinan gagal, yaitu 1- P ditunjukkan seperti di bawah ini.

  is,

  In [P - is / (1 - P is s i (1) )] = Ө β

  Ketika tingkat kesulitan aitem meningkat, maka log odds akan menurun. Ketika tingkat kesulitan aitem sama dengan trait level, log odds akan bernilai 0. Jika trait level lebih besar daripada tingkat kesulitan aitem, maka orang tersebut akan lebih mungkin untuk berhasil. Sebaliknya, jika tingkat kesulitan aitem lebih besar daripada trait level, maka orang tersebut lebih berkemungkinan untuk gagal (Embretson, 2000).

  Terdapat beberapa ciri dari Rasch model seperti di bawah ini (Embretson, 2000).

  1. Estimasi trait level dapat dilakukan pada aitem manapun yang telah diketahui tingkat kesulitan aitemnya.

  2. Kedua properti aitem dan trait level berkaitan dengan perilaku karena pada subjek dan aitem terdapat parameter-parameter yang terpisah.

  3. Trait level dan properti aitem merupakan variabel independen yang

  4. Probabilitas respon akan meningkat dengan menjumlahkan nilai konstan ada trait level atau dengan membagi kesulitan aitem dengan nilai konstan tersebut.

  Pada versi probability, variabel dependen merupakan probabilitas subjek s untuk berhasil pada aitem i, P(X

  is =1). Fungsi logistik ini memberikan prediksi sebagai berikut (Embretson, 2000).

  Ө β

  Ө – β Ө – β

  (2) Perbedaan versi ini dengan versi sebelumnya adalah variabel dependen diprediksi sebagai probabilitas daripada sebagai log odds. Versi ini juga dikenal sebagai model pengukuran 1 parameter. Salah satu kelebihan versi ini yaitu probabilitas merupakan variabel dependen yang lebih familiar dibandingkan rasio log odds. Dengan model ini karakter yang mempengaruhi performansi subjek diasumsikan adalah hanya kesulitan aitem.

  Model logistik 2 parameter memiliki dua elemen dalam bentuk matematikanya, yaitu parameter daya beda (a) dan parameter kesulitan aitem (b). Sedangkan, model logistik 3 parameter ditujukan pada aitem pilihan berganda karena adanya tambahan parameter peluang tebakan (c).

  Pada penelitian ini, model yang dipilih adalah model logistik 1 parameter untuk melihat parameter kesulitan aitem pada subtes RA dengan alasan lebih praktis dan lebih mudah untuk dilakukan oleh peneliti. Metode estimasi yang akan digunakan adalah metode kemungkinan maksimum marginal. Metode ini disarankan karena membantu mengurangi pengaruh panjang tes maupun sampel dengan asumsi bahwa distribusi kemampuan adalah normal.

  3) Parameter Teori Respon Butir

  Pada teori respon butir terdapat tiga unsur parameter yaitu paramater aitem, parameter peserta dan parameter respon (Naga, 1992). Ketiga unsur ini berhubungan sehingga menghasilkan fungsi atau Kurva Karakteristik Aitem. Hal ini tampak dari respon peserta terhadap aitem yang berhubungan dengan atau dapat ditentukan oleh ciri aitem atau ciri peserta yang bersangkutan.

  Dalam hubungan ini, ciri peserta dinyatakan melalui parameter peserta (Ө), ciri aitem dinyatakan melalui tiga parameter aitem a, b, dan c, serta ciri respon dinyataka n dalam bentuk probabilitas jawaban benar (P(Ө)).

Parameter peserta (Ө) hanya bisa diukur melalui respon subjek terhadap suatu aitem yang membentuk suatu kontinum. Secara teoritis, nilai

  baku untuk parameter peserta membentang dari minus tak terhingga sampai positif tidak terhingga. Namun secara praktis, nilai baku yang dianggap berguna hanya terletak antara -4 sampai +4.

  Parameter aitem a adalah parameter aitem yang berkaitan dengan daya beda yaitu kemampuan aitem untuk mempertegas perbedaan subjek yang mampu menjawab dengan benar dan yang tidak. Nilai parameter aitem a bergerak daru 0 sampai dengan +2. Kemudian, parameter aitem b adalah parameter aitem yang berkaitan dengan kesulitan aitem yaitu sulit atau mudahnya aitem tersebut untuk dijawab oleh subjek. Nilai parameter aitem b berkaitan dengan peluang tebakan semu subjek yakni peluang yang dapat menyebabkan subjek secara kebetulan menjawab aitem tersebut dengan benar.

  Nilai responsi atau jawaban benar dari subjek terhadap aitem tersebut terletak di antara 0 dan 1.

  4) Fungsi Informasi Aitem dan Tes

  Konsep informasi psikometri merupakan ciri penting dalam teori respon butir. Melalui hal ini sebuah item-response curve (IRC) pada model dikotomi atau category-response curve pada model politomi dapat diubah menjadi item information curve (IIC). IIC mengindikasikan jumlah informasi psikometris yang dimiliki sebuah aitem di sepanjang kontinum latent-trait (Embretson, 2000).

  Formula informasi aitem pada 1PL ditunjukkan seperti di bawah ini.

  I

  (Ө) = P i (Ө)(1- P i (Ө)) (3) Terdapat beberapa aturan dalam formula ini, yaitu sebagai berikut.

  a) Jumlah informasi dari sebuah aitem dimaksimalkan pada parameter kesulitan aitem, sehingga aitem yang memiliki kesulitan yang sama dengan kemampuan subjek akan sangat informatif.

  b)

Jumlah informasi yang disediakan sebuah aitem ditentukan dari parameter diskriminasinya. Semakin tinggi diskriminasi aitemnya, maka semakin

  banyak informasi aitem yang akan diberikan menyangkut parameter kesulitan aitem (Embretson, 2000).

  Informasi tes juga merupakan hal yang penting dalam menentukan

  

measurement subjek. Dengan mengetahui fungsi informasi tes, peneliti dapat

  menentukan seberapa baik sebuah tes dalam rentang latent trait. Perlu diketahui pula bahwa informasi tes merupakan suatu hal yang independen pada subjek tertentu yang mengikuti tes (Embretson, 2000).

  Terdapat banyak pengunaan informasi aitem dan informasi tes dalam teori respon butir. Pertama, informasi tes digunakan untuk menentukan aitem mana yang akan diberikan pada subjek tertentu ketika melakukan

  

computerized adaptive test. Kedua, informasi tes dapat digunakan untuk

  membandingkan dua pengukuran konstrak yang sama. Terakhir, informasi aitem dapat dimanfaatkan untuk desain tes dasar, seperti memilih aitem yang akan dimasukkan ke dalam sebuah pengukuran (Embretson, 2000).

  Perbedaan versi ini dengan versi sebelumnya adalah variabel dependen diprediksi sebagai probabilitas daripada sebagai log odds. Versi ini juga dikenal sebagai model pengukuran 1 parameter. Salahsatu kelebihan versi ini yaitu probabilitas merupakan variabel dependen yang lebih familiar dibandingkan rasio log odds (Embretson, 2000).

  Subtes ini terdiri dari 20 soal cerita hitungan matematika praktis yang mengungkap kemampuan berpikir praktis mengenai bilangan. Aspek-aspek yang terdapat dalam subtes RA yaitu berpikir secara logis-induktif, berpikir praktis dalam masalah hitungan, daya nalar, dan kemampuan mengambil kesimpulan.

  Polhaupessy (2009) menjelaskan bahwa terdapat beberapa aspek dalam subtes RA. Pembagian aspek-aspek di dalam keduapuluh aitem subtes RA dijelaskan dalam tabel 1.

  Tabel 1. Aspek Aitem Subtes RA

  No Aspek Nomor Aitem

  1 Berpikir praktis dalam masalah hitungan 1, 2, 3, 4, 5, 6, 7, 8, 11

  2 Berpikir logis indukif 9, 10, 12, 13, 14, 15, 16, 17

  3 Daya nalar 18, 19, 20

  4 Kemampuan mengambil keputusan 18, 19, 20 Berpikir praktis dalam masalah hitungan artinya adalah berhitung dengan cara-cara yang efisien dan mudah (Alwi, 2005). Aspek ini diungkap oleh 9 aitem atau 45% aitem subtes RA. Aspek berpikir logis induktif yaitu berpikir dengan logika yang berangkat dari serangkaian fakta-fakta khusus untuk mencapai kesimpulan umum (Alwi, 2005). Kesimpulan yang ditarik dari hal yang diteliti akan juga berlaku bagi hal yang sejenis namun belum diteliti. Aspek ini terungkap dari 8 aitem atau 40% aitem subtes RA.

  Alwi (2005) mendefinisikan aspek daya nalar sebagai kemampuan untuk mengembangkan pikiran atau menganalisa berdasarkan fakta, bukti, atau prinsip yang masuk akal. Aspek terakhir yaitu kemampuan mengambil keputusan merupakan kemampuan untuk mengambil keputusan berdasarkan pemikiran induktif maupun deduktif (Alwi, 2005). Kedua aspek ini terungkap dari 3 aitem atau 15% aitem subtes RA.

  Subtes RA memiliki waktu pengerjaan 10 menit tanpa menggunakan alat bantu kalkulator. Hasil subtes RA sendiri bisa digunakan terpisah sebagai alat ukur kemampuan berpikir praktis mengenai bilangan seseorang. Hal ini dikarenakan subtes-subtes IST memiliki interkorelasi yang rendah antar subtes.

  IST dikembangkan oleh Rudolf Amthauer di Frankfurt, Jerman, pada tahun 1953. Amthauer mengungkapkan bahwa inteligensi adalah keseluruhan struktur dari kemampuan jiwa-rohani manusia yang akan tampak jelas dalam hasil tes. Intelegensi hanya akan dapat dikenali atau dilihat melalui manifestasinya misalnya pada hasil atau prestasi suatu tes (Polhaupessy, 2009).

  Amthaeuer (dalam Polhaupessy, 2009) menyatakan bahwa untuk mengukur intelegensi seseorang diperlukan suatu rangkaian baterai tes yang terdiri dari subtes-subtes. Antara subtes satu dengan lainnya, ada yang saling berhubungan karena mengukur faktor yang sama (general factor atau group

  

factor ), tetapi ada juga yang tidak berhubungan karena masing-masing subtes

mengukur faktor khusus (special factor).

  Semenjak diciptakan, IST terus dikembangkan oleh Amthauer dengan bantuan dari para koleganya, berikut adalah perkembangan tes IST dari tahun 1953 hingga tahun 2000-an. a.

  IST 1953

  IST yang pertama ini pada awalnya hanya digunakan untuk individu usia 14 sampai dengan 60 tahun. Proses penyusunan norma diambil dari 4000 subjek pada tahun 1953.

  b.

  IST 1955

  IST merupakan pengembangan dari IST 1953, pada IST 1955 rentang usia untuk subjek diperluas menjadi berawal dari umur 13 tahun. Subjek dalam penyusunan norma bertambah menjadi 8642 orang. Pada tes ini sudah ada pengelompokan jenis kelamin dan kelompok usia.

  c.

IST 70

  Berdasarkan permintaan dan tuntutan pengguna yang menyarankan pengkoreksian dengan mesin juga pengembangan tes setelah penggunaan lebih dari 10 tahun, maka disusunlah IST 70. Dalam IST 70 ini tidak terlalu banyak perubahan, tes ini memiliki 6 bentuk, setiap pemeriksaan dilakukan 2 tes sebagai bentuk parallel; yaitu A1 dan B2, atau C3 dan D4. Dua bentuk lainnya untuk pemerintah dan hanya bagi penggunaan khusus. Pada IST 70, rentang kelompok usia diperluas menjadi berawal dari 12 tahun. Disamping itu telah ditambah tabel kelompok dan pekerjaan. Namun demikian, pada IST 70 terdapat kekurangan yaitu penyebaran bidang yang tidak merata dan menggunakan kalimat dalam subtes RA sehingga jika subjek gagal dalam subtes ini dapat dimungkinkan karena tidak mampu mengerjakan soal hitungannya atau tidak mengerti kalimatnya. d.

  IST 2000 Sebagai koreksi dari IST 70, pada IST 2000 tidak terdapat soal kalimat pada soal hitungan.

  e.

  IST 2000-Revised Pada IST 2000-R ini terdapat beberapa perkembangan subtes juga penambahan subtes. IST ini terdiri dari 3 modul, yaitu sebagai berikut :

  1) Grundmodul-Kurzform (Modul Dasar-Singkatan); terdiri dari subtes : SE, AN, GE, RE, ZR, RZ, FA, WU, dan MA.

  2) Modul ME: terdiri dari subtes ME Verbal dan ME Figural

  3) Erweiterungmodul (Modul menguji pengetahuan); terdiri dari subtes

  Wissentest (tes pengetahuan)

  IST yang sekarang digunakan di Indonesia adalah IST hasil adaptasi Fakultas Psikologi Universitas Padjajaran Bandung. Adaptasi ini dilakukan kepada IST-70. Tes ini pertama kali digunakan oleh Psikolog Angkatan Darat Bandung, Jawa Barat (Polhaupessy, 2009).

  IST terdiri dari sembilan subtes dengan total 176 aitem. Masing- masing subtes memiliki durasi pengerjaan yang berbeda-beda dan diadministrasikan dengan menggunakan manual (Polhaupessy, 2009). Kesembilan subtes tersebut antara lain: a.

  Satzeranzung (SE) : melengkapi kalimat Subtes ini mengukur pembentukan keputusan, melakukan penilaian berdasarkan akal sehat, common sense, dan praktis, serta berpikir secara mandiri. Durasi yang diberikan untuk mengerjakan subtes ini adalah 6 menit.

  b.

  Wortauswahl (WA) : melengkapi kalimat Subtes ini mengukur kemampuan bahasa, berpikr verbal secara induktif, kemampuan berempati, dan memahami pengertian bahasa. Durasi yang diberikan untuk mengerjakan subtes ini adalah 6 menit.

  c.

  Analogien (AN) : persamaan kata Subtes ini mengukur kemampuan pengkombinasian, fleksibilitas dalam berpikir, mendeteksi dan memindahkan hubungan-hubungan, kejelasan dan kekonsuenan dalam berpikir, serta pertentangan terhadap penjelasan yang mengira-ngira. Durasi yang diberikan untuk mengerjakan subtes ini adalah 7 menit.

  d.

  Gemeinsamkeiten (GE) : sifat yang dimiliki bersama Subtes ini mengukur kemampuan abstraksi verbal, kemampuan menyatakan pengertian sesuatu dalam bahasa, serta berpikir logis dalam bentuk bahasa. Durasi yang diberikan untuk mengerjakan subtes ini adalah 8 menit.

  e.

Merk Aufgaben (ME) : latihan simbol

  Subtes ini mengukur kemampuan memberikan perhatian, kemampuan menyimpan kata-kata yang telah dipelajari, kemampuan mengingat dalam waktu jangka lama, serta daya ingat. Durasi yang diberikan untuk subtes ini adalah 3 menit untuk menghafal dan 6 menit untuk mengerjakan. f.

  Rechen Aufgaben (RA) : berhitung Subtes ini mengukur kemampuan berpikir praktis dalam melakukan hitungan, berpikir secara logis-induktif, berpikir secara matematis, daya nalar, dan kemampuan mengambil kesimpulan. Durasi yang diberikan untuk mengerjakan subtes ini adalah 10 menit.

  g.

  Zahlen Reihen (ZR) : deret angka Subtes ini mengukur kemampuan berpikir teoritis dalam masalah hitungan, berpikir secara induktif dengan angka-angka, serta fleksibilitas dalam berpikir. Durasi yang diberikan untuk mengerjakan subtes ini adalah 10 menit.

  h.

  Form Auswahl (FA) : memilih bentuk Subtes ini mengukur kemampuan membayangkan, kemampuan mengkonstruksi, berpikir konkrit menyeluruh, serta memasukkan bagian pada suatu keseluruhan. Durasi yang diberikan untuk mengerjakan subtes ini adalah 7 menit. i.

Wurfel Aufgaben (WU) : latihan balok

  Subtes ini mengukur daya bayang ruang, kemampuan tiga dimensi, analitis, serta kemampuan konstruktif teknis. Durasi yang diberikan untuk mengerjakan subtes ini adalah 9 menit.

  Penelitian ini berfokus pada revisi aitem pada subtes RA. Hal ini dikarenakan subtes RA memiliki hasil evaluasi karakteristi psikometri yang lebih lengkap dibandingkan subtes lain yang juga telah diuji karakteristik psikometrinya. Hasil tersebut menunjukkan bahwa subtes RA memiliki karakteristik psikometri yang kurang baik sehingga perlu direvisi.

  Sari dan Rahmawati (2011) menemukan bahwa subtes ini memiliki interkorelasi tinggi dengan 8 subtes lainnya, berkisar dari 0.417 sampai 0.999.

  Hal ini menunjukkan bahwa subtes RA tidak lagi berfungsi sebagaimana tes ini disusun oleh Amthauer pada tahun 1953.

  Reliabilitas subtes RA juga tidak mencapai nilai 0.90 seperti yang seharusnya karena hanya sebesar 0.851. Analisis indeks kesukaran aitem memperlihatkan bahwa terdapat 15 aitem memiliki nilai p mendekati 0 maupun 1. Padahal, Murphy & Davidshofer (2003) mengungkapkan bahwa nilai p yang baik berada pada rentang 0.30 < p < 0.70. Analisis indeks daya beda aitem menunjukkan terdapat 4 aitem yang memiliki d < 0.40, yaitu aitem nomor 77, 93, 94, dan 96. Hal ini mencerminkan bahwa aitem tersebut kurang mampu membedakan kemampuan berpikir praktis mengenai perhitungan, berpikir matematis, logis-induktif, penalaran, serta daya pengambilan keputusan individu.

  Rahmawati (2014) menganalisa DIF subtes ini dan menemukan terdapat 4 aitem menguntungkan kelompok perempuan yaitu aitem nomor 81, 82, 85, dan 88 dan 4 aitem menguntungkan kelompok laki-laki yaitu aitem nomor 78, 80, 87, dan 96. Adanya DIF pada 8 aitem dalam subtes RA mencerminkan bahwa tes tidak dapat menunjukkan perbedaan kemampuan antarindividu yang sesungguhnya. Sebaliknya, tes justru menunjukkan

  (2014) menemukan bahwa berdasarkan pendekatan Item Response Theory terdapat 10 aitem memiliki indeks daya diskriminasi aitem dalam kategori kurang baik yaitu aitem nomor 84, 85, 88, 89, 90, 91, 92, 93, 94, dan 95 serta terdapat 5 aitem memiliki indeks kesukaran aitem yang kurang baik yaitu aitem nomor 77, 93, 94, 95, dan 96.

  Penemuan-penemuan di atas membuat peneliti tertarik dalam melakukan revisi subtes RA dibandingkan pada subtes lainnya karena telah memiliki data yang lebih lengkap yang menunjukkan bahwa subtes RA perlu direvisi, yang meliputi indeks kesukaran aitem, daya diskriminasi aitem, dan deteksi DIF berdasarkan jenis kelamin.