BAB II LANDASAN TEORI A. Kepribadian Big Five - Adaptasi Alat Ukur Kepribadian Big Five Factor Marker dari International Personality Item Pool (IPIP)

BAB II LANDASAN TEORI A. Kepribadian Big Five

  1. Sejarah Perkembangan Kepribadian Big Five Kepribadian telah dikonsepkan dari bermacam-macam perspektif teoritis yang masing-masing berbeda tingkat keluasannya (McAdams dalam John &

  Srivastava, 1999). Masing-masing tingkatan ini memiliki keunikan dalam memahami perbedaan individu dalam perilaku dan pengalamannya. Meskipun begitu, jumlah trait kepribadian dan skala kepribadian tetap dirancang tanpa henti- hentinya (Goldberg dalam John & Srivastava, 1999).

  Psikologi kepribadian memerlukan model deskriptif atau taksonomi mengenai kepribadian itu sendiri. Salah satu tujuan utama taksonomi dalam ilmu pengetahuan adalah untuk menyederhanakan defenisi yang saling tumpang-tindih. Oleh karena itu, dalam psikologi kepribadian, suatu taksonomi akan mempermudah para peneliti untuk meneliti sumber utama karakteristik kepribadian sehingga tidak hanya sekedar memeriksa ribuan atribut yang berbeda- beda yang membuat setiap individu berbeda dan unik (John & Srivastava, 1999).

  Satu dari peneliti paling berpengaruh dalam menerapkan prosedur empiris membangun suatu taksonomi kepribadian adalah Raymond B. Cattel, yang memulai dengan suatu bacaan deskripsi-kepribadian dalam bahasa Inggris. Variabel Cattel ketika dianalisis menggunakan metode rotasi ortogonal, hanya memunculkan lima faktor (Digman & Takemoto-Chock, Fiske, Norman, Tupes &

  12 Christal dalam Goldberg, 1990). Struktur lima faktor yang mirip, namun berdasarkan variabel set yang lain juga telah dilaporkan oleh Borgatta pada tahun 1964, Digman dan Inoyue pada tahun 1986, serta McCrae dan Costa pada tahun 1985. Lima faktor ini selanjutnya disebut Big Five. Faktor Big Five tersebut dinamai dan dinomori sebagai berikut: I. Surgency (atau Extraversion); II.

  

Agreeableness ; III. Conscientoiusness; IV. Emotional Stability (kebalikan dari

Neuroticsm ); dan V. Culture. Faktor kelima, yaitu culture diinterpretasikan secara

  alternatif oleh Digman & Takemoto-Chock pada 1981 serta Peabody & Goldberg pada 1989 sebagai Intellect. Dan oleh McCrae & Costa pada 1987 sebagai

  Openness (Goldberg, 1990).

  Pada 1981, Goldberg mengulas beberapa riset dan menyarankan bahwa ada kemungkinan setiap model penstrukturan perbedaan individual akan mencakup - pada level yang sama - segala sesuatu seperti dimensi Big Five. Dengan demikian faktor big five menjadi faktor eksistensi. Kata Big maksudnya merujuk kepada temuan bahwa tiap faktor menggolongkan banyak sifat tertentu (Pervin, 2005).

  Dimensi Big Five tidak mencerminkan perspektif teoritis tertentu, tetapi merupakan hasil dari analisis bahasa alami manusia dalam menjelaskan dirinya sendiri dan orang lain. Taksonomi Big Five bukan bertujuan untuk mengganti sistem yang terdahulu, melainkan sebagai penyatu karena dapat memberikan penjelasan sistem kepribadian secara umum (John & Srivastava, 1999).

  Big Five disusun bukan untuk menggolongkan individu ke dalam satu

  kepribadian tertentu, melainkan untuk menggambarkan sifat-sifat kepribadian yang disadari oleh individu itu sendiri dalam kehidupannya sehari-hari. Pendekatan ini disebut Goldberg sebagai Fundamental Lexical (Language)

  

Hypothesis ; perbedaan individu yang paling mendasar digambarkan hanya dengan

satu istilah yang terdapat pada setiap bahasa (Pervin, 2005).

2. Trait Kepribadian Big Five

  Ada dua model faktor Big Five yang dikenal secara luas, yaitu oleh Goldberg dan McCrae. Kedua model ini sebanding, perbedaan minornya ialah pada penamaan (faktor Emotional Stability dan Intellect dalam model Goldberg disebut Neuroticism dan Openeness to experience dalam model McCrae dan Costa) serta dasar teoritis dari kedua model tersebut (Guenelo &Chernyshenko, 2005).

  Ilustrasi makna dari berbagai faktor Big Five ialah sebagai berikut,

  

Neuroticism bertolak belakang dengan Emotional Stability dalam hal luasnya

  cakupan perasaan negatif, termasuk kecemasan, rasa sedih, rasa rapuh, dan ketegangan saraf. Keterbukaan terhadap pengalaman (Openess) mendeskripsikan keluasan, kedalaman, dan kompleksitas mental individual dan kehidupan eksperiensial. Extraversion dan Agreeableness merangkum sifat yang interpersonal, maksudnya, sifat-sifat tersebut menggambarkan apa yang dilakukan orang kepada orang lain dan dengan orang lain. Dan Conscientiousness pada dasarnya mendeskripsikan perilaku berorientasi tugas dan tujuan dan kontrol impuls yang dipersyaratkan secara sosial (Pervin, 2005).

  Faktor-faktor Big Five oleh Goldberg adalah Extraversion, Agreeableness,

  

Conscientiousness , Emotional Stability dan Intellect. Kelima faktor tersebut merupakan faktor bipolar yang memiliki sisi berlawanan tiap faktornya. Goldberg mendefinisikan berbagai faktor Big Five dalam inventory of bipolar trait, yaitu (Pervin, 2005): 1.

  Extraversion vs Introversion. Individu dengan nilai tinggi (Extraversion) dikarakteristikan dengan senang berbicara, tegas, suka tantangan, energik, berani. Sedangkan individu dengan nilai rendah (Introversion) dikarakteristikkan sebaliknya.

  2. Agreeableness vs Antagonism. Individu dengan nilai tinggi (Agreeableness) dikarakteristikkan dengan baik hati, kooperatif, tidak egois, dapat dipercaya, dermawan. Sedangkan individu dengan nilai rendah (Antagonism) dikarakteristikkan sebaliknya.

  3. Conscientiousness vs Lack of Direction. Individu dengan nilai tinggi

  (Conscientiousness) dikarakteristikkan dengan terorganisir, bertanggung jawab, praktis, peduli, pekerja keras. Sedangkan individu dengan nilai rendah (Lack of direction) dikarakteristikkan sebaliknya.

  4. Emotional Stability vs Neuroticsm. Individu dengan nilai tinggi (Emotional

stability ) dikarakteristikkan dengan rileks, santai, stabil, puas, tidak emosional.

  Sedangkan individu dengan nilai rendah (Neuroticism) dikarakteristikkan sebaliknya.

  5. Openness to new experience vs closedness. Individu dengn nilai tinggi (Openness to new experience) dikarakteristikkan dengan imajinatif, kreatif, ingin tahu, reflektif, rumit. Sedangkan individu dengan nilai rendah (Closedness) dikarakteristikkan sebaliknya.

  Selain inventory bipolar Goldberg, kuesioner lain yang juga digunakan secara luas untuk mengukur Big Five ialah NEO-PI-R oleh Costa dan McCrae.

  Bukti menunjukkan bahwa skala NEO-PI-R juga sesuai dengan instrumen Big

  

Five oleh Goldberg (John & Srivastava, Benet-Martinez & John, dalam Pervin,

  2005). Walaupun demikian, penting diperhatikan adanya beberapa perbedaan berkaitan dengan segi mana yang ditekankan pada tiap instrumen.

  Sebagai contoh, Costa dan McCrae menempatkan segi kehangatan pada

  

Extraversion sedangkan para periset Big Five lain menemukan kehangatan yang

lebih berkaitan dengan Agreeableness (John & Srivastava dalam Pervin, 2005).

  Silang pendapat terjadi khususnya dalam konseptualisasi faktor kelima, Openness. Goldberg menekankan pengenalan intelektual dan kreatif dalam pengukuran faktornya, dan karena itu menamakannya Intellect (Kecerdasan) atau Imagination (Imajinasi); McCrae mengkritik pandangan tersebut terlalu menyempitkan definisi faktor Openness. (Pervin, 2005)

B. Big Five Factor Marker

  International Personality Item Pool (IPIP) diusulkan oleh Goldberg

sebagai seorang scientific collaboratory untuk pengembangan pengukuran trait

kepribadian dan perbedaan individual. Selama bertahun-tahun, website IPIP yaitu

  http://ipip.ori.org/ telah menyediakan set pengukuran yang semakin meningkat,

  

kesemuanya dalam domain publik, tersedia untuk peneliti seluruh dunia (Mlacic,

2007).

  Big Five factor Marker dari IPIP merupakan kumpulan aitem-aitem oleh

Godberg yang terdiri dari beberapa pernyataan pendek. Satu tujuan Goldberg pada

  

factor markers adalah untuk menyediakan suatu set aitem-aitem yang singkat

  yang dapat menghasilkan struktur target lima faktor, yang dapat dibandingkan

  

dengan posisi teoritis alternatif dan kuesioner kepribadian lainnya ( Guenole &

  Chernyshenko, 2005) Aitem-aitem pada Big Five Factor Marker berupa pernyataan-pernyataan pendek dan sederhana yang diskor berdasarkan metode penskalaan Likert lima tingkatan yaitu “sangat tidak sesuai”, “tidak sesuai”, “netral”, “sesuai”, dan “sangat sesuai”. Big Five Factor Marker terdiri dari dua versi, yaitu versi pendek dan versi panjang. Versi pendek terdiri dari 50 aitem dan versi panjang terdiri dari 100 aitem.

C. Adaptasi Alat ukur

  1. Definisi Adaptasi Alat Ukur Istilah adaptasi sangat luas dan menunjukkan apa yang harus dilakukan ketika menyiapkan suatu tes yang dikonstruksi dalam satu bahasa dan budaya untuk digunakan dalam bahasa dan budaya berbeda. Adaptasi tes termasuk aktifitas dari menentukan apakah test dapat mengukur konstruk yang sama dalam bahasa dan budaya yang berbeda, memilih penerjemah, memutuskan akomodasi yang sesuai yang akan dibuat dalam mempersiapkan tes untuk digunakan dalam bahasa kedua, sampai mengadaptasi tes dan mengecek kesetaraannya dalam bentuk yang diadaptasi (Hambleton, Merenda, & Spielberger 2005).

  2. Tahap-tahap dalam Proses Adaptasi Berikut 3 tahapan dalam proses adaptasi: a. Penelaahan Koeksistensi Konstruk yang Diukur

  Tahap pertama merupakan tahap studi untuk mencermati koeksistensi dari konstruk yang hendak diukur beserta operasionalisasinya di lingkungan sosial budaya asal dan lingkungan sosial budaya dimana tes psikologi tersebut akan digunakan. Penelaahan konstruk ini sangat penting karena adanya temuan bahwa budaya menjadi faktor penting yang mempengaruhi pemunculan perilaku. Sebagai konsekuensinya, perilaku tidak dapat diukur atau dianalisis secara terpisah dari budaya setempat. Bahkan alat tes yang “terbebas dari faktor budaya” atau “culture

  

fair ” sekalipun tetap merefleksikan adanya perbedaan budaya. Sehingga konteks

  budaya harus selalu dipertimbangkan dalam pengembangan maupun pengadaptasian tes psikologi yang pada awalnya berasal dari budaya yang berbeda (Supratiknya & Susana, 2010).

  Konstruk merepresentasikan variabel abstrak yang diperoleh melalui hasil pengamatan maupun teori. Fungsi dari konstruk ini terutama adalah untuk menjelaskan kesatuan dari suatu proses pemunculan perilaku. Masalah pokok dalam adaptasi tes adalah bahwa suatu konstruk yang sama di dua atau lebih lingkungan budaya, sangat mungkin mempunyai perbedaan pada variabel spesifik yang digunakan untuk mengukur konstruk. Contohnya dalam pertanyaan “Do you

  

usually enter into conversation with fellow passengers on a bus ?” Pada instrumen

  dalam bahasa aslinya, pertanyaan tersebut dimaksudkan untuk menjaring konstruk

  

introversion-extraversion . Tetapi di lingkungan sosial budaya yang berpandangan bahwa menegur orang di bis merupakan tindakan yang dapat dianggap “ofensive”, pernyataan ini akan merefleksikan kontinum aggression-submission (Supratiknya & Susana, 2010).

  b.

  Tahap Alih Bahasa Tujuan utama dari tahap ini adalah menerjemahkan instrumen / alat ukur, dalam artian membuat material tes mudah dimengerti dan dapat digunakan dengan mengalih-bahasakannya ke bahasa di lingkungan budaya setempat. Menerjemahkan tidak berarti menggantikan setiap kata dengan kata lain yang berasal dari bahasa yang akan digunakan di dalam tes (Supratiknya & Susana, 2010).

  Menerjemahkan tes adalah salah satu dari langkah-langkah dalam proses adaptasi tes, dan bahkan dalam langkah ini istilah adaptasi lebih cocok digunakan daripada menerjemahkan untuk menggambarkan proses yang sebenarnya terjadi. Ini karena penerjemah berusaha untuk menemukan konsep, kata-kata, dan pernyataan yang setara secara budaya, psikologis, dan linguistik dalam budaya dan bahasa kedua (Hambleton, Merenda, & Spielberger 2005).

  Jumlah frekuensi kata-kata dapat memberikan sumbangan dalam memproduksi adaptasi tes yang valid. Secara umum, menerjemahkan kata-kata dan ekspresi dengan kata-kata dan ekspresi yang kurang lebih sama dalam bahasa kedua sangat baik dalam upaya untuk mengendalikan kesulitan kata-kata pada lintas bahasa. Masalahnya adalah frekuensi daftar kata-kata dan ekspresi tersebut tidak selalu tersedia. Ini juga yang merupakan alasan untuk lebih memilih penerjemah yang sudah mengenal budaya target dan bukan hanya bahasa (Hambleton, Merenda, & Spielberger 2005).

  Beberapa kata dan ekspresi tidak memiliki arti kata dan ekspresi yang setara dalam bahasa target. Bahkan mungkin kata-kata dan ekspresi tersebut tidak ada dalam bahasa target. Sehingga De-centering terkadang digunakan dalam mengadaptasi tes. De-centering merupakan pembuatan revisi bahasa dalam tes, sehingga materi yang setara dapat digunakan pada bahasa asal dan versi bahasa target. De-Centering mungkin dilakukan ketika sumber bahasa tes sedang dalam pengembangan pada waktu yang sama dengan bahasa target. Ini adalah situasi dimana tes ditujukan untuk digunakan dalam pengukuran Internasional dan beberapa tes yang dirangcang untuk digunakan diseluruh dunia (Hambleton, Merenda, & Spielberger 2005).

  Berikut beberapa tahapan dalam alih bahasa: 1)

  Seleksi dan pelatihan penerjemah Mendapatkan jasa penerjemah yang kompeten sudah jelas sangat penting.

  Meskipun seringkali, peneliti mencoba untuk melalui proses translasi dengan penerjemah tunggal yang dipilih karena ia kebetulan tersedia- seorang teman, istri dari seorang rekan, seseorang yang bisa disewa murah, dan sebagainya. Seorang penerjemah tunggal dapat menampilkan, misalnya perspektif, pilihan untuk lebih menyukai kata-kata dan ungkapan tertentu, yang mungkin bukan yang paling cocok untuk menghasilkan adaptasi tes yang baik. Penerjemah ganda dapat melindungi terhadap bahaya penerjemah tunggal dan preferensi serta kekhasannya (Hambleton, Merenda, & Spielberger 2005).

  Selain itu, penerjemah harus lebih dari orang yang akrab dan kompeten dengan bahasa yang terlibat dalam terjemahan. Mereka harus mengetahui budaya dengan sangat baik, terutama budaya target (budaya diasosiasikan dengan bahasa dari tes yang diadaptasi) (Hambleton, Merenda, & Spielberger 2005).

  2) Desain Penilain dalam Mengadaptasi Tes

  Dua desain yang paling populer adalah forward translation dan backward

  

translation . Dalam desain forward translation, seorang penerjemah, ataupun

sekelompok penerjemah mengadaptasi tes dari bahasa asalnya ke bahasa target.

  Kemudian, kesamaan dari kedua versi tes ini dinilai oleh kelompok penerjemah lain. Revisi dapat dibuat pada versi tes bahasa target untuk memperbaiki masalah yang diidentifikasi oleh para penerjemah. Terkadang sebagai langkah terakhir, orang lain, meski tidak harus penerjemah, akan mengedit tes versi bahasa target untuk menghaluskan bahasa (Hambleton, Merenda, & Spielberger 2005).

  Keuntungan utama dari desai forward translation ini adalah penilaian dilakukan secara langsung tentang kesetaraan bahasa asal dan versi bahasa target tes. Sedangkan kelemahan utamanya dasosiasikan dengan tingginya tingkat kesimpulan yang harus dibuat penerjemah tentang kesetaraan dari kedua versi tes.

  Kelemahan lainnya termasuk (a) penerjemah mungkin lebih ahli dalam satu bahasa daripada bahasa lainnya, (b) penilaian kesetaraan tes melibatkan penilaian oleh orang yang bilingual, sehingga mereka dapat menggunakan dugaan berdasarkan pengetahuan mereka tentang kedua bahasa, (c) penerjemah bisa saja lebih baik tingkat pendidikannya daripada peserta (untuk siapa tes ini dimaksudkan) sehingga mereka melupakan beberapa masalah yang akan dihadapi oleh peserta dan (d) pengembang tes tidak dalam posisi untuk menilai kesetaraan tes itu sendiri (Hambleton, Merenda, & Spielberger 2005).

  Desain back translation adalah desain penilaian yang dikenal paling baik dan paling populer. Dalam versinya yang paling populer, satu atau lebih penerjemah mengadaptasi tes dari bahasa asal ke bahasa target. Selanjutnya penerjemah yang berbeda mengadaptasi kembali tes yang telah diadaptasi (dalam bahasa target) kedalam bahasa asalnya. Kemudian, versi asli dan versi yang telah diadaptasi kembali dibandingkan dan dinilai kesetaraannya. Sejauh kedua versi tes dalam bahasa asal terlihat mirip, namun tetap memperhatikan kesetaraan dari tes versi bahasa asal dan bahasa target (Hambleton, Merenda, & Spielberger 2005).

  Desain back-translation dapat digunakan untuk menyediakan pemeriksaan secara umum baik pada kualitas penerjemahan dan untuk mendeteksi setidaknya beberapa masalah yang terkait dengan terjemahan atau adaptasi yang buruk. Para peneliti menyukai desain ini karena memberikan mereka kesempatan untuk menilai tes versi asli dan versi yang sudah diterjemahkan kembali sehingga mereka dapat membentuk pendapat mereka sendiri tentang proses adaptasi. Hal ini tentu tidak mungkin dilakukan dalam desain forward-translation kecuali mereka mahir dalam bahasa tersebut (Hambleton, Merenda, & Spielberger 2005).

  c.

  Tahap empirik: Memastikan Kesetaraan Psikometrik Tujuan utama dari pengadaptasian tes psikologi adalah untuk mendapatkan versi yang secara psikometrik ekuivalen / setara tetapi menggunakan bahasa yang berbeda dengan bahasa aslinya (Supratiknya & Susana, 2010).

  Berikut Karakteristik Psikometrik dalam suatu tes: 1)

  Validitas Validitas dapat disefinisikan sebagai kesesuaian antara skor tes dengan kualitas tes dalam mengukur. Validitas juga dapat didefinisikan sebagai jawaban dari “ apakah tes mengukur apa yang seharusnya diukur”. Pada 1985 American

  

Educational Research Association (AERA), American Psychological Association

  (APA), dan National Council on Measurement in Education (NCME) mempublikasikan buku berjudul Standard for Educational and Psychological

  

Testing . Standar yang terdapat dalam buku tersebut direvisi pada 1999,

  didalamnya terdapat suatu set petunjuk tes psikologi yang telah disetujui oleh banyak kelompok profesional (Kaplan, 2005).

  Terlepas dari beberapa kemungkinan definisi validitas, komite gabungan dalam penyusunan buku tersebut menyatakan bahwa validitas adalah fakta-fakta yang digunakan sebagai kesimpulan suatu skor tes. Terdapat tiga tipe fakta: (1) konstruk, (2) kriteria, (3) konten atau isi. Banyak nama lain untuk perbedaan aspek validitas, namun kebanyakan aspeknya dapat dilihat dari kategori ini (Kaplan, 2005).

  Standar terbaru menekankan bahwa validitas adalah konsep kesatuan yang merepresentasikan seluruh fakta mendukung interpretasi suatu pengukuran.

  Persetujuan umum menyatakan untuk berhati-hati pada pembagian validitas atas beberapa subkategori seperti validitas konten, validitas prediksi, dan validitas kriteria. Meskipun mengkategorisasikan perbedaan tipe validitas adalah hal baik, namun penggunaan kategori tidak mengimplikasikan bahwa ada perbedaan bentuk validitas (Kaplan, 2005).

  Berikut dipaparkan beberapa jenis validitas: a. Validitas Konten / Isi Validitas konten merupakan cakupan representasi dari konsep tes.

  Misalnya tes dalam suatu mata pelajaran, validitas konten menyajikan kesesuaian antara aitem-aitem tes dengan informasi yang ada pada setiap materi dalam mata pelajaran tersebut. Karena batasan-batasan antara validitas konten dan validitas tipe lainnya tidak didefinisikan secara jelas, validitas konten bukan merupakan sesuatu yang bisa dipisahkan dari tipe validitas lainnya (Anastasi dalam Kaplan, 2005). Namun, validitas konten lebih unik karena tipe validitas ini lebih menekankan pada logika daripada statistika (Kaplan, 2005).

  Menentukan apakah tes telah dikonstruk dengan baik adalah cara untuk melihat validitas konten. Misalnya apakah aitem-aitemnya adalah sampel yang sesuai dari keseluruhan konten. Menetapkan validitas konten dalam suatu tes membutuhkan logika yang baik, intuisi, serta ketekunan karena konten dari setiap aitem harus dievaluasi dengan hati-hati. Penetapan validitas konten dibuat oleh penilaian ahli (expert judgment). Metode statistik seperti analisis faktor juga telah digunakan untuk menentukan apakah aitem sesuai dengan domain konseptual (Sireci dalam Kaplan, 2005). b.

  Validitas Kriteria Validitas kriteria menjelaskan seberapa baik suatu tes dapat disamakan dengan kriteria tertentu. Ini diperlihatkan dengan tingginya korelasi antara skor suatu tes dengan suatu skor pengukuran kriteria. Kriteria adalah standar tes yang dibandingkan. Misalnya tes digunakan untuk memprediksi pasangan mana yang akan memiliki kesuksesan pernikahan dan pasangan mana yang akan bercerai.Kesuksesan pernikahan adalah kriteria, namun kesuksesan pernikahan tidak dapat begitu sajadiketahui pada saat pasangan mengikuti tes prapernikahan. Alasan adanya validitas kriteria adalah sebagai “stand-in” dalam pengukuran psikologi. Misalnya dalam pernikahan, tes pranikah disajikan sebagai “stand-in” dalam mengestimasi kebahagiaan pernikahan dimasa depan (Kaplan, 2005).

  c.

  Validitas Konstruk Validitas konstruk menekankan pada suatu rangkaian aktivitas dimana peneliti secara simultan mendefinisikan beberapa konstruk dan mengembangkan instrumen untuk mengukurnya. Proses ini dibutuhkan ketika tidak ada kriteria atau konten secara umum yang diterima untuk mendefinisikan kualitas yang ingin diukur (Cronbach & Meehl, Sackett, dalam Kaplan 2005). Perhatian validitas konstruk fokus pada peran teori psikologis dalam konstruksi tes dan pada kebutuhan untuk membuat hipotesa yang nantinya dapat dibuktikan atau tidak dalam proses validasi (Anastasi, 1997).

  Mengumpulkan fakta mengenai apa makna dari suatu tes termasuk dalam validitas konstruk. Ini dilakukan dengan menampilkan hubungan antara suatu tes dengan tes lainnya. Pada saat hubungan tersebut didemonstrasikan, satu makna dapat ditambahkan kedalam tes. Setelah serangkaian studi, makna dari tes berangsur-angsur mulai terbentuk. Pengumpulan fakta mengenai validitas konstruk merupakan suatu proses terus menerus yang mirip dengan mengumpulkan fakta-fakta pendukung untuk suatu teori ilmiah yang kompleks (Kaplan, 2005).

  Dikembangkan sebagai suatu cara dalam mengidentifikasi trait psikologi, faktor analisis juga relevan dalam prosedur validitas konstruk. Intinya, faktor analisis adalah suatu teknik statistik untuk menganalisis hubungan timbal balik data perilaku (behavior). Misalnya, 20 tes telah diberikan kepada 300 orang, langkah pertama yang dilakukan adalah menghitung korelasi masing-masing tes dengan seluruh tes. Pemeriksaan tabel hasil dari 190 korelasi mengungkapkan kelas-kelas tertentu diantara tes-tes tersebut, sehingga menyarankan adanya lokasi untuk trait-trait yang umum. Selanjutnya, jika beberapa tes seperti perbendaharaan kata, analogi, lawan kata, dan melengkapi kalimat memiliki korelasi tinggi satu dengan lainnya dan berkorelasi rendah dengan tes lainnya, secara sementara dapat disimpulkan terdapat faktor pemahaman verbal. Dikarenakan menganalisis daftar korelasi sulit dan meragukan, teknik statistik yang lebih seksama telah dikembangkan untuk menempatkan faktor-faktor umum yang dibutuhkan untuk dihitung korelasinya (Anastasi, 1997).

  Jumlah variabel atau kategori pada masing-masing performa individu dalam tes asli dikurangi hingga membentuk sejumlah faktor-faktor kecil atau trait umum dalam proses analisis faktor. Dalam contoh diatas, lima atau enam faktor mungkin cukup untuk menghitung korelasi diantara ke 20 tes tersebut. Skor masing-masing individu dapat dideskripsikan dalam lima atau enam faktor, bukan 20 skor aslinya. Tujuan utama dari analisis faktor adalah untuk menyederhanakan deskripsi perilaku (behavior) dengan mengurangi kategori variabel tes awal menjadi beberapa faktor umum atau trait-trait (Anastasi, 1997).

  Setelah faktor-faktor diidentifikasi, kemudian dijelaskan susunan faktorial tesnya. Masing-masing tes dapat dikarakteristikkan dalam istilah faktor utamanya yang menentukan skornya, bersamaan dengan bobot atau muatan masing-masing faktor dan korelasi tes dengan masing-masing faktor. Korelasi seperti ini dilaporkan sebagai validitas faktorial (factorial validity) tes. Jika faktor pemahaman verbal berkorelasi 0.66 dengan tes perbendaharaan kata, validitas faktorial dari tes perbendaharaan kata sebagai suatu alat ukur trait pemahaman verbal adalah 0.66 (Anastasi, 1997).

  2) Reliabilitas

  Suatu pengukuran dikatakan reliabel jika menghasilkan skor tes yang konsisten dan stabil yang tidak banyak dipengaruhi oleh random error. Konsep reliabilitas mendasari perhitungan error of measurement dari skor tunggal, dimana tingkat fluktuasi yang biasanya terjadi dalam skor tunggal individu sebagai akibat dari faktor penyimpangan atau yang tidak diketahui dapat diprediksi (Anastasi, 1997).

  Konsep reliabilitas telah digunakan dalam mencakup beberapa aspek dari skor konsistensi. Dalam pengertian luasnya, reliabilitas tes mengindikasikan perbedaan individual yang terlihat dalam skor tes yang disebabkan oleh “benar- benar” berbeda dalam karakteristiknya dibawah pertimbangan disebabkan oleh eror. Teknisnya, pengukuran reliabilitas tes memungkinkan untuk memperkirakan proporsi error varians dari total varians dalam skor tes (Anastasi, 1997).

  Pada 1937 Kuder dan Richardson mengembangkan metode untuk mengevaluasi reliabilitas dalam administrasi tes tunggal. Formula Kuder digunakan untuk menghitung reliabilitas dari tes yang aitem-aitemnya dikotomi (benar-salah) yang diskor 0-1. Namun ada banyak tipe tes yang tidak memiliki jawaban benar-salah, seperti tes kepribadian yang tidak ada jawaban benar maupun salah. Individu biasanya diminta untuk merespon dimana dirinya berada dalam suatu kontinum. Untuk menggunakan metode Kuder-Richardson dalam aitem jenis ini, Cronbach mengembangkan suatu formula untuk mengestimasi internal consistency tesnya yang dikenal dengan coefficient alpha (Kaplan, 2005).

  Pengukuran internal konsistensi mengevaluasi aitem-aitem dalam tes yang mengukur kemampuan atau trait yang sama. Reliabilitas tes akan rendah jika tes dirancang untuk mengukur beberapa trait. Misalnya, suatu domain merepresentasikan trait atau karakteristik tunggal, dan masing-masing aitem adalah sampel individual dari karakteristik umum. Ketika aitem tidak mengukur karakteristik yang sama, tes tidak akan konsisten secara internal (Kaplan, 2005).

3. Sumber-sumber Error dalam Adaptasi

  The American Educational Research Association (AERA), American

Psychological Association (APA), dan National Council on Measurement in

Education (NCME) dalam Standards for Educational and Psychological Testing

  menyediakan arahan yang cermat untuk para spesialis pengukuran pendidikan dan psikolog yang memilih, mengembangkan, dan menggunakan alat ukur pendidikan dan tes psikologi. Tiga diantaranya sangat relevan dalam konteks adaptasi tes:

  1. Ketika seorang pengguna tes membuat perubahan besar dalam format tes, cara administrasi, instruksi, bahasa, atau konten, pengguna harus memvalidasi ulang penggunaan tes untuk kondisi yang diubah atau memiliki alasan yang mendukung klaim bahwa validasi tambahan tidak diperlukan atau tidak mungkin dilakukan.

  2. Ketika satu tes diterjemahkan dari satu dialek atau bahasa pada dialek atau bahasa lainnya, reliabilitas dan validitas untuk penggunaan dalam kelompok bahasa yang akan diuji harus ditetapkan.

3. Ketika dimaksudkan bahwa dua versi dari tes dual-bahasa sebanding, bukti komparatif tes harus dilaporkan.

  Standar tersebut menyediakan suatu kerangka untuk mempertimbangkan sumber kesalahan atau error yang mungkin timbul dalam upaya untuk mengadaptasi tes dari satu bahasa dan budaya ke bahasa dan budaya lain. Sumber- sumber error atau ketidakabsahan yang timbul dalam adaptasi tes dapat disusun kedalam tiga kategori luas: (a) perbedaan budaya / bahasa, (b) masalah teknis,desain, dan metode, serta (c) interpretasi hasil. (Hambleton, Merenda, & Spielberger 2005)