Big Five Factor Marker Adaptasi Alat ukur

Selain inventory bipolar Goldberg, kuesioner lain yang juga digunakan secara luas untuk mengukur Big Five ialah NEO-PI-R oleh Costa dan McCrae. Bukti menunjukkan bahwa skala NEO-PI-R juga sesuai dengan instrumen Big Five oleh Goldberg John Srivastava, Benet-Martinez John, dalam Pervin, 2005. Walaupun demikian, penting diperhatikan adanya beberapa perbedaan berkaitan dengan segi mana yang ditekankan pada tiap instrumen. Sebagai contoh, Costa dan McCrae menempatkan segi kehangatan pada Extraversion sedangkan para periset Big Five lain menemukan kehangatan yang lebih berkaitan dengan Agreeableness John Srivastava dalam Pervin, 2005. Silang pendapat terjadi khususnya dalam konseptualisasi faktor kelima, Openness. Goldberg menekankan pengenalan intelektual dan kreatif dalam pengukuran faktornya, dan karena itu menamakannya Intellect Kecerdasan atau Imagination Imajinasi; McCrae mengkritik pandangan tersebut terlalu menyempitkan definisi faktor Openness. Pervin, 2005

B. Big Five Factor Marker

International Personality Item Pool IPIP diusulkan oleh Goldberg sebagai seorang scientific collaboratory untuk pengembangan pengukuran trait kepribadian dan perbedaan individual. Selama bertahun-tahun, website IPIP yaitu http:ipip.ori.org telah menyediakan set pengukuran yang semakin meningkat, kesemuanya dalam domain publik, tersedia untuk peneliti seluruh dunia Mlacic, 2007. Big Five factor Marker dari IPIP merupakan kumpulan aitem-aitem oleh Godberg yang terdiri dari beberapa pernyataan pendek. Satu tujuan Goldberg pada Universitas Sumatera Utara factor markers adalah untuk menyediakan suatu set aitem-aitem yang singkat yang dapat menghasilkan struktur target lima faktor, yang dapat dibandingkan dengan posisi teoritis alternatif dan kuesioner kepribadian lainnya Guenole Chernyshenko, 2005 Aitem-aitem pada Big Five Factor Marker berupa pernyataan-pernyataan pendek dan sederhana yang diskor berdasarkan metode penskalaan Likert lima tingkatan yaitu “sangat tidak sesuai”, “tidak sesuai”, “netral”, “sesuai”, dan “sangat sesuai”. Big Five Factor Marker terdiri dari dua versi, yaitu versi pendek dan versi panjang. Versi pendek terdiri dari 50 aitem dan versi panjang terdiri dari 100 aitem.

C. Adaptasi Alat ukur

1. Definisi Adaptasi Alat Ukur Istilah adaptasi sangat luas dan menunjukkan apa yang harus dilakukan ketika menyiapkan suatu tes yang dikonstruksi dalam satu bahasa dan budaya untuk digunakan dalam bahasa dan budaya berbeda. Adaptasi tes termasuk aktifitas dari menentukan apakah test dapat mengukur konstruk yang sama dalam bahasa dan budaya yang berbeda, memilih penerjemah, memutuskan akomodasi yang sesuai yang akan dibuat dalam mempersiapkan tes untuk digunakan dalam bahasa kedua, sampai mengadaptasi tes dan mengecek kesetaraannya dalam bentuk yang diadaptasi Hambleton, Merenda, Spielberger 2005. Universitas Sumatera Utara 2. Tahap-tahap dalam Proses Adaptasi Berikut 3 tahapan dalam proses adaptasi: a. Penelaahan Koeksistensi Konstruk yang Diukur Tahap pertama merupakan tahap studi untuk mencermati koeksistensi dari konstruk yang hendak diukur beserta operasionalisasinya di lingkungan sosial budaya asal dan lingkungan sosial budaya dimana tes psikologi tersebut akan digunakan. Penelaahan konstruk ini sangat penting karena adanya temuan bahwa budaya menjadi faktor penting yang mempengaruhi pemunculan perilaku. Sebagai konsekuensinya, perilaku tidak dapat diukur atau dianalisis secara terpisah dari budaya setempat. Bahkan alat tes yang “terbebas dari faktor budaya” atau “culture fair” sekalipun tetap merefleksikan adanya perbedaan budaya. Sehingga konteks budaya harus selalu dipertimbangkan dalam pengembangan maupun pengadaptasian tes psikologi yang pada awalnya berasal dari budaya yang berbeda Supratiknya Susana, 2010. Konstruk merepresentasikan variabel abstrak yang diperoleh melalui hasil pengamatan maupun teori. Fungsi dari konstruk ini terutama adalah untuk menjelaskan kesatuan dari suatu proses pemunculan perilaku. Masalah pokok dalam adaptasi tes adalah bahwa suatu konstruk yang sama di dua atau lebih lingkungan budaya, sangat mungkin mempunyai perbedaan pada variabel spesifik yang digunakan untuk mengukur konstruk. Contohnya dalam pertanyaan “Do you usually enter into conversation with fellow passengers on a bus?” Pada instrumen dalam bahasa aslinya, pertanyaan tersebut dimaksudkan untuk menjaring konstruk introversion-extraversion. Tetapi di lingkungan sosial budaya yang berpandangan Universitas Sumatera Utara bahwa menegur orang di bis merupakan tindakan yang dapat dianggap “ofensive”, pernyataan ini akan merefleksikan kontinum aggression-submission Supratiknya Susana, 2010. b. Tahap Alih Bahasa Tujuan utama dari tahap ini adalah menerjemahkan instrumen alat ukur, dalam artian membuat material tes mudah dimengerti dan dapat digunakan dengan mengalih-bahasakannya ke bahasa di lingkungan budaya setempat. Menerjemahkan tidak berarti menggantikan setiap kata dengan kata lain yang berasal dari bahasa yang akan digunakan di dalam tes Supratiknya Susana, 2010. Menerjemahkan tes adalah salah satu dari langkah-langkah dalam proses adaptasi tes, dan bahkan dalam langkah ini istilah adaptasi lebih cocok digunakan daripada menerjemahkan untuk menggambarkan proses yang sebenarnya terjadi. Ini karena penerjemah berusaha untuk menemukan konsep, kata-kata, dan pernyataan yang setara secara budaya, psikologis, dan linguistik dalam budaya dan bahasa kedua Hambleton, Merenda, Spielberger 2005. Jumlah frekuensi kata-kata dapat memberikan sumbangan dalam memproduksi adaptasi tes yang valid. Secara umum, menerjemahkan kata-kata dan ekspresi dengan kata-kata dan ekspresi yang kurang lebih sama dalam bahasa kedua sangat baik dalam upaya untuk mengendalikan kesulitan kata-kata pada lintas bahasa. Masalahnya adalah frekuensi daftar kata-kata dan ekspresi tersebut tidak selalu tersedia. Ini juga yang merupakan alasan untuk lebih memilih Universitas Sumatera Utara penerjemah yang sudah mengenal budaya target dan bukan hanya bahasa Hambleton, Merenda, Spielberger 2005. Beberapa kata dan ekspresi tidak memiliki arti kata dan ekspresi yang setara dalam bahasa target. Bahkan mungkin kata-kata dan ekspresi tersebut tidak ada dalam bahasa target. Sehingga De-centering terkadang digunakan dalam mengadaptasi tes. De-centering merupakan pembuatan revisi bahasa dalam tes, sehingga materi yang setara dapat digunakan pada bahasa asal dan versi bahasa target. De-Centering mungkin dilakukan ketika sumber bahasa tes sedang dalam pengembangan pada waktu yang sama dengan bahasa target. Ini adalah situasi dimana tes ditujukan untuk digunakan dalam pengukuran Internasional dan beberapa tes yang dirangcang untuk digunakan diseluruh dunia Hambleton, Merenda, Spielberger 2005. Berikut beberapa tahapan dalam alih bahasa: 1 Seleksi dan pelatihan penerjemah Mendapatkan jasa penerjemah yang kompeten sudah jelas sangat penting. Meskipun seringkali, peneliti mencoba untuk melalui proses translasi dengan penerjemah tunggal yang dipilih karena ia kebetulan tersedia- seorang teman, istri dari seorang rekan, seseorang yang bisa disewa murah, dan sebagainya. Seorang penerjemah tunggal dapat menampilkan, misalnya perspektif, pilihan untuk lebih menyukai kata-kata dan ungkapan tertentu, yang mungkin bukan yang paling cocok untuk menghasilkan adaptasi tes yang baik. Penerjemah ganda dapat melindungi terhadap bahaya penerjemah tunggal dan preferensi serta kekhasannya Hambleton, Merenda, Spielberger 2005. Universitas Sumatera Utara Selain itu, penerjemah harus lebih dari orang yang akrab dan kompeten dengan bahasa yang terlibat dalam terjemahan. Mereka harus mengetahui budaya dengan sangat baik, terutama budaya target budaya diasosiasikan dengan bahasa dari tes yang diadaptasi Hambleton, Merenda, Spielberger 2005. 2 Desain Penilain dalam Mengadaptasi Tes Dua desain yang paling populer adalah forward translation dan backward translation. Dalam desain forward translation, seorang penerjemah, ataupun sekelompok penerjemah mengadaptasi tes dari bahasa asalnya ke bahasa target. Kemudian, kesamaan dari kedua versi tes ini dinilai oleh kelompok penerjemah lain. Revisi dapat dibuat pada versi tes bahasa target untuk memperbaiki masalah yang diidentifikasi oleh para penerjemah. Terkadang sebagai langkah terakhir, orang lain, meski tidak harus penerjemah, akan mengedit tes versi bahasa target untuk menghaluskan bahasa Hambleton, Merenda, Spielberger 2005. Keuntungan utama dari desai forward translation ini adalah penilaian dilakukan secara langsung tentang kesetaraan bahasa asal dan versi bahasa target tes. Sedangkan kelemahan utamanya dasosiasikan dengan tingginya tingkat kesimpulan yang harus dibuat penerjemah tentang kesetaraan dari kedua versi tes. Kelemahan lainnya termasuk a penerjemah mungkin lebih ahli dalam satu bahasa daripada bahasa lainnya, b penilaian kesetaraan tes melibatkan penilaian oleh orang yang bilingual, sehingga mereka dapat menggunakan dugaan berdasarkan pengetahuan mereka tentang kedua bahasa, c penerjemah bisa saja lebih baik tingkat pendidikannya daripada peserta untuk siapa tes ini dimaksudkan sehingga mereka melupakan beberapa masalah yang akan dihadapi Universitas Sumatera Utara oleh peserta dan d pengembang tes tidak dalam posisi untuk menilai kesetaraan tes itu sendiri Hambleton, Merenda, Spielberger 2005. Desain back translation adalah desain penilaian yang dikenal paling baik dan paling populer. Dalam versinya yang paling populer, satu atau lebih penerjemah mengadaptasi tes dari bahasa asal ke bahasa target. Selanjutnya penerjemah yang berbeda mengadaptasi kembali tes yang telah diadaptasi dalam bahasa target kedalam bahasa asalnya. Kemudian, versi asli dan versi yang telah diadaptasi kembali dibandingkan dan dinilai kesetaraannya. Sejauh kedua versi tes dalam bahasa asal terlihat mirip, namun tetap memperhatikan kesetaraan dari tes versi bahasa asal dan bahasa target Hambleton, Merenda, Spielberger 2005. Desain back-translation dapat digunakan untuk menyediakan pemeriksaan secara umum baik pada kualitas penerjemahan dan untuk mendeteksi setidaknya beberapa masalah yang terkait dengan terjemahan atau adaptasi yang buruk. Para peneliti menyukai desain ini karena memberikan mereka kesempatan untuk menilai tes versi asli dan versi yang sudah diterjemahkan kembali sehingga mereka dapat membentuk pendapat mereka sendiri tentang proses adaptasi. Hal ini tentu tidak mungkin dilakukan dalam desain forward-translation kecuali mereka mahir dalam bahasa tersebut Hambleton, Merenda, Spielberger 2005. c. Tahap empirik: Memastikan Kesetaraan Psikometrik Tujuan utama dari pengadaptasian tes psikologi adalah untuk mendapatkan versi yang secara psikometrik ekuivalen setara tetapi menggunakan bahasa yang berbeda dengan bahasa aslinya Supratiknya Susana, 2010. Universitas Sumatera Utara Berikut Karakteristik Psikometrik dalam suatu tes: 1 Validitas Validitas dapat disefinisikan sebagai kesesuaian antara skor tes dengan kualitas tes dalam mengukur. Validitas juga dapat didefinisikan sebagai jawaban dari “ apakah tes mengukur apa yang seharusnya diukur”. Pada 1985 American Educational Research Association AERA, American Psychological Association APA, dan National Council on Measurement in Education NCME mempublikasikan buku berjudul Standard for Educational and Psychological Testing. Standar yang terdapat dalam buku tersebut direvisi pada 1999, didalamnya terdapat suatu set petunjuk tes psikologi yang telah disetujui oleh banyak kelompok profesional Kaplan, 2005. Terlepas dari beberapa kemungkinan definisi validitas, komite gabungan dalam penyusunan buku tersebut menyatakan bahwa validitas adalah fakta-fakta yang digunakan sebagai kesimpulan suatu skor tes. Terdapat tiga tipe fakta: 1 konstruk, 2 kriteria, 3 konten atau isi. Banyak nama lain untuk perbedaan aspek validitas, namun kebanyakan aspeknya dapat dilihat dari kategori ini Kaplan, 2005. Standar terbaru menekankan bahwa validitas adalah konsep kesatuan yang merepresentasikan seluruh fakta mendukung interpretasi suatu pengukuran. Persetujuan umum menyatakan untuk berhati-hati pada pembagian validitas atas beberapa subkategori seperti validitas konten, validitas prediksi, dan validitas kriteria. Meskipun mengkategorisasikan perbedaan tipe validitas adalah hal baik, Universitas Sumatera Utara namun penggunaan kategori tidak mengimplikasikan bahwa ada perbedaan bentuk validitas Kaplan, 2005. Berikut dipaparkan beberapa jenis validitas: a. Validitas Konten Isi Validitas konten merupakan cakupan representasi dari konsep tes. Misalnya tes dalam suatu mata pelajaran, validitas konten menyajikan kesesuaian antara aitem-aitem tes dengan informasi yang ada pada setiap materi dalam mata pelajaran tersebut. Karena batasan-batasan antara validitas konten dan validitas tipe lainnya tidak didefinisikan secara jelas, validitas konten bukan merupakan sesuatu yang bisa dipisahkan dari tipe validitas lainnya Anastasi dalam Kaplan, 2005. Namun, validitas konten lebih unik karena tipe validitas ini lebih menekankan pada logika daripada statistika Kaplan, 2005. Menentukan apakah tes telah dikonstruk dengan baik adalah cara untuk melihat validitas konten. Misalnya apakah aitem-aitemnya adalah sampel yang sesuai dari keseluruhan konten. Menetapkan validitas konten dalam suatu tes membutuhkan logika yang baik, intuisi, serta ketekunan karena konten dari setiap aitem harus dievaluasi dengan hati-hati. Penetapan validitas konten dibuat oleh penilaian ahli expert judgment. Metode statistik seperti analisis faktor juga telah digunakan untuk menentukan apakah aitem sesuai dengan domain konseptual Sireci dalam Kaplan, 2005. Universitas Sumatera Utara b. Validitas Kriteria Validitas kriteria menjelaskan seberapa baik suatu tes dapat disamakan dengan kriteria tertentu. Ini diperlihatkan dengan tingginya korelasi antara skor suatu tes dengan suatu skor pengukuran kriteria. Kriteria adalah standar tes yang dibandingkan. Misalnya tes digunakan untuk memprediksi pasangan mana yang akan memiliki kesuksesan pernikahan dan pasangan mana yang akan bercerai.Kesuksesan pernikahan adalah kriteria, namun kesuksesan pernikahan tidak dapat begitu sajadiketahui pada saat pasangan mengikuti tes prapernikahan. Alasan adanya validitas kriteria adalah sebagai “stand-in” dalam pengukuran psikologi. Misalnya dalam pernikahan, tes pranikah disajikan sebagai “stand-in” dalam mengestimasi kebahagiaan pernikahan dimasa depan Kaplan, 2005. c. Validitas Konstruk Validitas konstruk menekankan pada suatu rangkaian aktivitas dimana peneliti secara simultan mendefinisikan beberapa konstruk dan mengembangkan instrumen untuk mengukurnya. Proses ini dibutuhkan ketika tidak ada kriteria atau konten secara umum yang diterima untuk mendefinisikan kualitas yang ingin diukur Cronbach Meehl, Sackett, dalam Kaplan 2005. Perhatian validitas konstruk fokus pada peran teori psikologis dalam konstruksi tes dan pada kebutuhan untuk membuat hipotesa yang nantinya dapat dibuktikan atau tidak dalam proses validasi Anastasi, 1997. Mengumpulkan fakta mengenai apa makna dari suatu tes termasuk dalam validitas konstruk. Ini dilakukan dengan menampilkan hubungan antara suatu tes Universitas Sumatera Utara dengan tes lainnya. Pada saat hubungan tersebut didemonstrasikan, satu makna dapat ditambahkan kedalam tes. Setelah serangkaian studi, makna dari tes berangsur-angsur mulai terbentuk. Pengumpulan fakta mengenai validitas konstruk merupakan suatu proses terus menerus yang mirip dengan mengumpulkan fakta-fakta pendukung untuk suatu teori ilmiah yang kompleks Kaplan, 2005. Dikembangkan sebagai suatu cara dalam mengidentifikasi trait psikologi, faktor analisis juga relevan dalam prosedur validitas konstruk. Intinya, faktor analisis adalah suatu teknik statistik untuk menganalisis hubungan timbal balik data perilaku behavior. Misalnya, 20 tes telah diberikan kepada 300 orang, langkah pertama yang dilakukan adalah menghitung korelasi masing-masing tes dengan seluruh tes. Pemeriksaan tabel hasil dari 190 korelasi mengungkapkan kelas-kelas tertentu diantara tes-tes tersebut, sehingga menyarankan adanya lokasi untuk trait-trait yang umum. Selanjutnya, jika beberapa tes seperti perbendaharaan kata, analogi, lawan kata, dan melengkapi kalimat memiliki korelasi tinggi satu dengan lainnya dan berkorelasi rendah dengan tes lainnya, secara sementara dapat disimpulkan terdapat faktor pemahaman verbal. Dikarenakan menganalisis daftar korelasi sulit dan meragukan, teknik statistik yang lebih seksama telah dikembangkan untuk menempatkan faktor-faktor umum yang dibutuhkan untuk dihitung korelasinya Anastasi, 1997. Jumlah variabel atau kategori pada masing-masing performa individu dalam tes asli dikurangi hingga membentuk sejumlah faktor-faktor kecil atau trait umum dalam proses analisis faktor. Dalam contoh diatas, lima atau enam faktor Universitas Sumatera Utara mungkin cukup untuk menghitung korelasi diantara ke 20 tes tersebut. Skor masing-masing individu dapat dideskripsikan dalam lima atau enam faktor, bukan 20 skor aslinya. Tujuan utama dari analisis faktor adalah untuk menyederhanakan deskripsi perilaku behavior dengan mengurangi kategori variabel tes awal menjadi beberapa faktor umum atau trait-trait Anastasi, 1997. Setelah faktor-faktor diidentifikasi, kemudian dijelaskan susunan faktorial tesnya. Masing-masing tes dapat dikarakteristikkan dalam istilah faktor utamanya yang menentukan skornya, bersamaan dengan bobot atau muatan masing-masing faktor dan korelasi tes dengan masing-masing faktor. Korelasi seperti ini dilaporkan sebagai validitas faktorial factorial validity tes. Jika faktor pemahaman verbal berkorelasi 0.66 dengan tes perbendaharaan kata, validitas faktorial dari tes perbendaharaan kata sebagai suatu alat ukur trait pemahaman verbal adalah 0.66 Anastasi, 1997. 2 Reliabilitas Suatu pengukuran dikatakan reliabel jika menghasilkan skor tes yang konsisten dan stabil yang tidak banyak dipengaruhi oleh random error. Konsep reliabilitas mendasari perhitungan error of measurement dari skor tunggal, dimana tingkat fluktuasi yang biasanya terjadi dalam skor tunggal individu sebagai akibat dari faktor penyimpangan atau yang tidak diketahui dapat diprediksi Anastasi, 1997. Konsep reliabilitas telah digunakan dalam mencakup beberapa aspek dari skor konsistensi. Dalam pengertian luasnya, reliabilitas tes mengindikasikan perbedaan individual yang terlihat dalam skor tes yang disebabkan oleh “benar- Universitas Sumatera Utara benar” berbeda dalam karakteristiknya dibawah pertimbangan disebabkan oleh eror. Teknisnya, pengukuran reliabilitas tes memungkinkan untuk memperkirakan proporsi error varians dari total varians dalam skor tes Anastasi, 1997. Pada 1937 Kuder dan Richardson mengembangkan metode untuk mengevaluasi reliabilitas dalam administrasi tes tunggal. Formula Kuder digunakan untuk menghitung reliabilitas dari tes yang aitem-aitemnya dikotomi benar-salah yang diskor 0-1. Namun ada banyak tipe tes yang tidak memiliki jawaban benar-salah, seperti tes kepribadian yang tidak ada jawaban benar maupun salah. Individu biasanya diminta untuk merespon dimana dirinya berada dalam suatu kontinum. Untuk menggunakan metode Kuder-Richardson dalam aitem jenis ini, Cronbach mengembangkan suatu formula untuk mengestimasi internal consistency tesnya yang dikenal dengan coefficient alpha Kaplan, 2005. Pengukuran internal konsistensi mengevaluasi aitem-aitem dalam tes yang mengukur kemampuan atau trait yang sama. Reliabilitas tes akan rendah jika tes dirancang untuk mengukur beberapa trait. Misalnya, suatu domain merepresentasikan trait atau karakteristik tunggal, dan masing-masing aitem adalah sampel individual dari karakteristik umum. Ketika aitem tidak mengukur karakteristik yang sama, tes tidak akan konsisten secara internal Kaplan, 2005. 3. Sumber-sumber Error dalam Adaptasi The American Educational Research Association AERA, American Psychological Association APA, dan National Council on Measurement in Education NCME dalam Standards for Educational and Psychological Testing menyediakan arahan yang cermat untuk para spesialis pengukuran pendidikan dan Universitas Sumatera Utara psikolog yang memilih, mengembangkan, dan menggunakan alat ukur pendidikan dan tes psikologi. Tiga diantaranya sangat relevan dalam konteks adaptasi tes: 1. Ketika seorang pengguna tes membuat perubahan besar dalam format tes, cara administrasi, instruksi, bahasa, atau konten, pengguna harus memvalidasi ulang penggunaan tes untuk kondisi yang diubah atau memiliki alasan yang mendukung klaim bahwa validasi tambahan tidak diperlukan atau tidak mungkin dilakukan. 2. Ketika satu tes diterjemahkan dari satu dialek atau bahasa pada dialek atau bahasa lainnya, reliabilitas dan validitas untuk penggunaan dalam kelompok bahasa yang akan diuji harus ditetapkan. 3. Ketika dimaksudkan bahwa dua versi dari tes dual-bahasa sebanding, bukti komparatif tes harus dilaporkan. Standar tersebut menyediakan suatu kerangka untuk mempertimbangkan sumber kesalahan atau error yang mungkin timbul dalam upaya untuk mengadaptasi tes dari satu bahasa dan budaya ke bahasa dan budaya lain. Sumber- sumber error atau ketidakabsahan yang timbul dalam adaptasi tes dapat disusun kedalam tiga kategori luas: a perbedaan budaya bahasa, b masalah teknis,desain, dan metode, serta c interpretasi hasil. Hambleton, Merenda, Spielberger 2005 Universitas Sumatera Utara 30

BAB III METODOLOGI PENELITIAN