Analisis Karakteristik Psikometri Edwards Personal Preference Schedule (EPPS)

(1)

SKRIPSI

Diajukan untuk memenuhi persyaratan Ujian Sarjana Psikologi

Oleh

DEDE SUHENDRI

101301078

FAKULTAS PSIKOLOGI

UNIVERSITAS SUMATERA UTARA


(2)

SKRIPSI

ANALISIS KARAKTERISTIK PSIKOMETRI EDWARDS PERSONAL PREFERENCE SCHEDULE (EPPS)

Dipersiapkan dan disusun oleh:

DEDE SUHENDRI 101301078

Telah dipertahankan di depan Dewan Penguji Pada tanggal 16 Juli 2014

Mengesahkan, Dekan Fakultas Psikologi

Prof. Dr. Irmawati, Psikolog NIP. 195301311980032001

Dewan Penguji

1. Etty Rahmawati, M. Si. Penguji I/Pembimbing

NIP: 198107252008012013 ______________

2. Ika Sari Dewi, S. Psi, Psikolog Penguji II

NIP: 197809102005012001 ______________


(3)

sesungguhnya bahwa skripsi saya yang berjudul:

Analisis Karakteristik Psikometri Edwards Personal Preference Schedule (EPPS)

adalah hasil karya sendiri dan belum pernah diajukan untuk memperoleh gelar kesarjanaan di Fakultas Psikologi Universitas Sumatera Utara.

Adapun bagian-bagian tertentu dalam penulisan skripsi ini saya kutip dari hasil karya orang lain yang telah dituliskan sumbernya secara jelas sesuai dengan norma, kaidah, dan etika penulisan ilmiah.

Apabila di kemudian hari ditemukan adanya kecurangan di dalam skripsi ini, saya bersedia menerima sanksi dari Fakultas Psikologi Universitas Sumatera Utara sesuai dengan peraturan yang berlaku.

Medan, Juli 2014 Dede Suhendri


(4)

Analisis Karakteristik Psikometri Edwards Personal Preference Schedule (EPPS) Dede Suhendri1 dan Etty Rahmawati2

ABSTRAK

Tes psikologi telah digunakan hampir dalam setiap bidang kehidupan, sehingga tes psikologi harus memiliki kualitas yang baik. Namun, ada faktor-faktor yang dapat mempengaruhi kualitas tes. Oleh karena itu, perlu dilakukan evaluasi terus menerus terhadap tes psikologi, sehingga selalu memiliki kualitas baik. Tujuan penelitian ini adalah untuk menganalisis karakteristik psikometri tes kepribadian Edwards Personal Preference Schedule (EPPS). Hal ini dilakukan untuk mengetahui apakah EPPS masih berfungsi sebagai alat tes kepribadian yang mengukur lima belas manifestasi kebutuhan Murray, yaitu dengan menganalisis bukti validitas berdasarkan struktur internal dan reliabilitas skor komposit. Penelitian ini menggunakan metode pengumpulan data dokumentasi. Data yang dipakai peneliti adalah data yang didokumentasi oleh Unit Pelayanan Pusat Penelitian dan Pengabdian pada Masyarakat (P3M) Fakultas Psikologi Universitas Sumatera Utara. Analisis bukti validitas berdasarkan struktur internal menunjukkan bahwa hasil pengukuran dengan menggunakan EPPS tidak valid untuk mengukur kelima belas manifestasi kebutuhan yang diungkap EPPS. Analisis reliabilitas menunjukkan hasil pengukuran EPPS dapat dipercaya. Hasil akhir menunjukkan EPPS merupakan alat tes yang reliabel, tetapi tidak valid untuk mengukur lima belas manifestasi kebutuhan Murray.

Kata Kunci: Edwards Personal Preference Schedule, Reliabilitas Skor Komposit, Bukti Validitas Berdasarkan Struktur Internal

1

Mahasiswa Fakultas Psikologi Universitas Sumatera Utara 2


(5)

Psychometric Characteristics Analysis of Edwards Personal Preference Schedule (EPPS)

Dede Suhendri1 and Etty Rahmawati2

ABSTRACT

Psychological tests have been used in almost every area of life, so psychologist tests must have a good quality. However, there are factors that can affect the quality of the tests. Therefore, it is necessary to evaluate psychological tests continuously, so the tests always have a good quality. The purpose of this study is to analyze the psychometric characteristics of the personality test, Edwards Personal Preference Schedule (EPPS). This is done to find out whether EPPS is still functioning as a personality test which measures fifteen Murray’s manifestation needs, that is by analyzing the validity evidence based on internal structure and the reliability of composite score. This study uses collecting documentation data method. The data researcher use is the data that is documented by P3M Faculty of Psychology University of North Sumatera. The validity evidence of internal structure analysis shows that the measurement’s result using EPPS is invalid to measure the fifteenth manifestation needs revealed

by EPPS. The reliability analysis shows that the measurement’s result of EPPS

can be trusted. The final result indicates that EPPS is a reliable test, but not a valid test to measure fifteen Murray’s manifestation needs.

Keyword: Edwards Personal Preference Schedule, Reliability of Composite Score, Validity Evidence Based on Internal Structure

1

Student of Faculty of Psychology, University of North Sumatera 2


(6)

KATA PENGANTAR

Pertama-tama, saya mengucapkan syukur kepada Tuhan Yang Maha Kuasa karena berkat karunia dan rahmat-Nya, saya mempunyai kesempatan dan kesehatan yang baik dalam menyelesaikan skripsi ini. Skripsi ini berjudul

“Analisis Karakteristik Psikometri Edwards Personal Preference Schedule (EPPS)”.

Peneliti juga telah mendapatkan banyak bimbingan, wawasan, dorongan, motivasi, nasehat, dan saran dari beberapa pihak selama proses penyusunan skripsi ini. Oleh sebab itu, peneliti sewajarnya mengucapkan terima kasih kepada: 1. Ibu Prof. Dr. Irmawati, psikolog selaku dekan Fakultas Psikologi Universitas

Sumatera Utara.

2. Ibu Etty Rahmawati, M. Si. selaku dosen pembimbing skripsi yang dengan sabar telah memberikan ilmu dan waktunya dalam membimbing penulis untuk menyelesaikan skripsi ini.

3. Ibu Lili Garliah, M. Si., psikologi dan Ibu Sri Supriyantini, M. Si., psikolog selaku dosen pembimbing akademik selama 8 (delapan) semester.

4. Ibu Ika Sari Dewi, S. Psi., psikolog dan Kakak Dina Nazriani, M. A. yang telah bersedia meluangkan waktunya untuk menguji peneliti serta memberikan ilmu kepada peneliti.

5. Keluarga saya yang telah mendukung saya menyelesaikan skripsi ini.

6. Pusat Penelitian dan Pengabdian pada Masyarakat (P3M) Fakultas Psikologi Universitas Sumatera Utara atas kesempatan dan kepercayaan yng diberikan


(7)

kepada saya untuk mengadakan penelitian di lingkungan institusinya, terutama Bapak Ferry Novliadi, M. Si. Selaku ketua P3M atas izinnya untuk membantu dalam penelitian ini.

7. Teman seperjuangan kuliah (Johan, Raja, Steven, Weillon, Jilly, Wieny, Venti, Veronica, Caroline, Irene, Vivian, Yohanti, Mayritza, dan Vera), terima kasih banyak.

8. Teman-teman ISEP (Reza Indah, Reza Yoga, Rocky, Mira, Rina, Sonya, Junika, dan Novira) yang mendukung saya dalam pembuatan skripsi. Terima kasih banyak.

9. Teman-teman Fakultas Psikologi Universitas Sumatera Utara Angkatan 2010 lain yang tidak dapat saya sebutkan satu persatu.

10.Teman-teman 2011 (Edberg, Vilya, Fonds, Puspa, Chindy, Fera, dan Merry) yang telah banyak memberi dukungan kepada saya dalam menyelesaikan skripsi ini.

11.Abang dan kakak-kakak senior, terutama Bang Agus dan Bang Hitler yang telah membantu saya menyelesaikan penelitian ini.

12.Seluruh pihak yang terlibat dalam penyelesaian skripsi ini namun tidak tersebut di atas. Peneliti menyampaikan terima kasih yang sebanyak-banyaknya atas dukungan dan bantuan yang telah diberikan.

Peneliti menyadari bahwa skripsi ini masih jauh dari kesempurnaan yang dikarenakan oleh keterbatasan kemampuan, fasilitias, waktu, dan pengetahuan yang dimiliki peneliti. Oleh karena itu, penulis mengharapkan segala kritik dan saran yang merupakan masukan bagi penulis untuk kesempurnaan skripsi ini.


(8)

Akhir kata penulis mengucapkan terima kasih dan semoga skripsi ini dapat bermanfaat.

Medan, Juli 2014


(9)

DAFTAR ISI

ABSTRAK ... i

ABSTRACT ... ii

KATA PENGANTAR ... iii

DAFTAR ISI ... vi

DAFTAR TABEL ... ix

DAFTAR LAMPIRAN ... x

BAB I PENDAHULUAN ... 1

A. Latar Belakang Permasalahan ... 1

B. Identifikasi Masalah ... 6

C. Rumusan Masalah ... 7

D. Tujuan Penelitian ... 7

E. Manfaat Penelitian ... 7

1. Manfaat Teoritis ... 7

2. Manfaat Praktis ... 8

BAB II TELAAH PUSTAKA ... 9

A. Analisis Karakteristik Psikometri ... 9

1. Validitas ... 9

a. Pengertian Validitas ... 9

b. Sumber Bukti Validitas ... 10

c. Interpretasi Validitas ... 14


(10)

a. Pengertian Reliabilitas ... 15

b. Metode Estimasi Reliabilitas ... 15

c. Formula Estimasi Reliabilitas ... 19

d. Faktor-Faktor yang Mempengaruhi Reliabilitas ... 21

e. Hubungan Reliabilitas dan Standard Error of Measurement ... 22

f. Interpretasi Reliabilitas ... 23

B. Edwards Personal Preference Schedule ... 24

1. Sejarah EPPS ... 24

2. Manisfestasi Kebutuhan EPPS ... 25

C. Analisis Karakteristik Psikometri EPPS ... 27

BAB III METODE PENELITIAN ... 29

A. Jenis Penelitian ... 29

B. Data yang Digunakan ... 29

C. Persiapan Pengambilan Data ... 30

1. Pembuatan Proposal ... 30

2. Persiapan Izin Pengambilan Data ... 30

3. Analisis Data ... 30

D. Metode Pengumpulan Data ... 31

E. Software yang Digunakan ... 31

F. Cara Analisis Data ... 32

1. Analisis Reliabilitas ... 32

2. Analisis Bukti Validitas Berdasarkan Struktur Internal ... 33


(11)

A. Deskripsi Umum Data Penelitian ... 36

B. Deskripsi Hasil ... 36

1. Analisis Bukti Validitas berdasarkan Struktur Internal ... 36

a. Uji Kecocokan Model ... 36

b. Analisis Nilai t dan Nilai Muatan Faktor pada Aitem Setiap Sub Bagian EPPS ... 38

c. Analisis Aitem EPPS ... 40

2. Analisis Reliabilitas ... 41

C. Pembahasan ... 41

BAB V KESIMPULAN & SARAN ... 45

A. Kesimpulan ... 45

B. Saran ... 45

1. Saran Praktis ... 45

2. Saran Metodologi ... 45

DAFTAR PUSTAKA ... 46


(12)

DAFTAR TABEL

Tabel 1. Perbandingan Ukuran-Ukuran GOF ... 35 Tabel 2. Nilai Goodness of Fit EPPS ... 37 Tabel 3. Rangkuman Kategorisasi Aitem Tidak Valid dan Valid ... 41


(13)

DAFTAR LAMPIRAN

Lampiran 1 Nilai GOF EPPS ... 49 Lampiran 2 Hasil Analisis Reliabilitas Skor Komposit ... 65


(14)

Analisis Karakteristik Psikometri Edwards Personal Preference Schedule (EPPS) Dede Suhendri1 dan Etty Rahmawati2

ABSTRAK

Tes psikologi telah digunakan hampir dalam setiap bidang kehidupan, sehingga tes psikologi harus memiliki kualitas yang baik. Namun, ada faktor-faktor yang dapat mempengaruhi kualitas tes. Oleh karena itu, perlu dilakukan evaluasi terus menerus terhadap tes psikologi, sehingga selalu memiliki kualitas baik. Tujuan penelitian ini adalah untuk menganalisis karakteristik psikometri tes kepribadian Edwards Personal Preference Schedule (EPPS). Hal ini dilakukan untuk mengetahui apakah EPPS masih berfungsi sebagai alat tes kepribadian yang mengukur lima belas manifestasi kebutuhan Murray, yaitu dengan menganalisis bukti validitas berdasarkan struktur internal dan reliabilitas skor komposit. Penelitian ini menggunakan metode pengumpulan data dokumentasi. Data yang dipakai peneliti adalah data yang didokumentasi oleh Unit Pelayanan Pusat Penelitian dan Pengabdian pada Masyarakat (P3M) Fakultas Psikologi Universitas Sumatera Utara. Analisis bukti validitas berdasarkan struktur internal menunjukkan bahwa hasil pengukuran dengan menggunakan EPPS tidak valid untuk mengukur kelima belas manifestasi kebutuhan yang diungkap EPPS. Analisis reliabilitas menunjukkan hasil pengukuran EPPS dapat dipercaya. Hasil akhir menunjukkan EPPS merupakan alat tes yang reliabel, tetapi tidak valid untuk mengukur lima belas manifestasi kebutuhan Murray.

Kata Kunci: Edwards Personal Preference Schedule, Reliabilitas Skor Komposit, Bukti Validitas Berdasarkan Struktur Internal

1

Mahasiswa Fakultas Psikologi Universitas Sumatera Utara 2


(15)

Psychometric Characteristics Analysis of Edwards Personal Preference Schedule (EPPS)

Dede Suhendri1 and Etty Rahmawati2

ABSTRACT

Psychological tests have been used in almost every area of life, so psychologist tests must have a good quality. However, there are factors that can affect the quality of the tests. Therefore, it is necessary to evaluate psychological tests continuously, so the tests always have a good quality. The purpose of this study is to analyze the psychometric characteristics of the personality test, Edwards Personal Preference Schedule (EPPS). This is done to find out whether EPPS is still functioning as a personality test which measures fifteen Murray’s manifestation needs, that is by analyzing the validity evidence based on internal structure and the reliability of composite score. This study uses collecting documentation data method. The data researcher use is the data that is documented by P3M Faculty of Psychology University of North Sumatera. The validity evidence of internal structure analysis shows that the measurement’s result using EPPS is invalid to measure the fifteenth manifestation needs revealed

by EPPS. The reliability analysis shows that the measurement’s result of EPPS

can be trusted. The final result indicates that EPPS is a reliable test, but not a valid test to measure fifteen Murray’s manifestation needs.

Keyword: Edwards Personal Preference Schedule, Reliability of Composite Score, Validity Evidence Based on Internal Structure

1

Student of Faculty of Psychology, University of North Sumatera 2


(16)

BAB I

PENDAHULUAN

A. Latar Belakang Permasalahan

Tes psikologi saat ini telah digunakan hampir dalam setiap bidang kehidupan. Dalam bidang pendidikan, tes psikologi digunakan untuk mengetahui minat dan bakat siswa. Selain itu, tes psikologi digunakan untuk mengetahui potensi akademik calon mahasiswa yang hendak masuk ke dalam suatu universitas. Dalam dunia kerja, tes psikologi digunakan untuk menyeleksi calon karyawan yang sesuai dengan posisi yang tersedia. Dalam bidang klinis, tes psikologi digunakan terapis untuk menentukan treatment yang sesuai untuk masalah klien. Hal ini menunjukkan bahwa pemahaman masyarakat mengenai manfaat tes psikologi sudah semakin meluas, sehingga penggunaannya semakin meningkat.

Tes psikologi adalah serangkaian aitem-aitem yang menjadi satu kesatuan untuk mengukur karakteristik atau sifat-sifat manusia yang dapat memprediksi perilakunya (Kaplan & Saccuzzo, 2005). Menurut Kaplan dan Saccuzzo (2005), tes psikologi dibagi menjadi dua jenis, yaitu tes kemampuan (ability test) dan tes kepribadian (personality test). Tes kemampuan digunakan untuk mengukur kemampuan dalam hal kecepatan, ketepatan, kecerdasan, ataupun ketiganya sekaligus. Berbeda dengan tes kemampuan, tes kepribadian digunakan untuk mengungkap sifat-sifat seseorang yang menentukan bagaimana individu tersebut berperilaku di masa depan.


(17)

Melihat tujuan penggunaannya, kedua jenis tes psikologi ini memiliki fungsi masing-masing yang sama pentingnya. Fungsi kedua tes psikologi yang penting ini menyebabkan tes kemampuan dan tes kepribadian selalu diadministrasikan bersama dalam proses perekrutan. Hal ini dikarenakan tes kepribadian mengungkap aspek yang penting. Ketika seseorang memiliki kepribadian yang tidak sesuai dengan jabatan kerjanya walaupun memiliki strategi pemecahan masalah yang sempurna, orang tersebut mungkin dapat melakukan strategi pemecahan masalah yang tidak efektif. Oleh karena itu, peneliti memilih tes kepribadian untuk dilakukan penelitian.

Pengukuran terhadap kepribadian sangat penting dilakukan (Pervin, Cervone, & Oliver, 2005). Selain itu, Pervin, dkk. (2005) mengatakan bahwa pengukuran terhadap kepribadian penting dilakukan untuk memahami aspek-aspek yang berbeda dalam setiap individu dan bagaimana hubungan individu dengan orang lain. Jadi, untuk mengukur kepribadian individu, dapat digunakan tes kepribadian. Tes kepribadian sering dipakai ketika perusahaan ingin merekrut karyawan yang ingin bekerja sehingga dapat mengisi posisi pekerjaan yang tersedia. Pemeriksaan psikologi dengan menggunakan tes kepribadian dapat digunakan untuk membantu manajemen atau perusahaan untuk mengoptimalisasi sumber daya manusia (Humanika Consulting, 2014). Selain itu, tes kepribadian juga digunakan untuk kebutuhan klinis, misalnya pada terapi atau konseling. Berdasarkan pengamatan peneliti, banyak biro-biro psikologi di Medan yang menggunakan tes psikologi, misalnya Unit Pelayanan Pusat Penelitian dan Pengabdian pada Masyarakat (selanjutnya akan disebut P3M) Fakultas Psikologi


(18)

3

USU, Humanika Solutama Consulting, dan Competence Psychological Firm (CPF). Dengan kata lain, tes kepribadian tentu saja harus memiliki kualitas yang baik, agar hasil tes tersebut dapat menggambarkan diri individu dengan tepat. Jika tes psikologi tidak memiliki kualitas yang baik, individu akan mendapatkan pekerjaan yang belum tentu sesuai dengan kepribadiannya. Tes kepribadian yang memiliki kualitas buruk juga dapat menyebabkan terapi atau konseling yang dilakukan tidak berhasil karena salah memberikan treatment.

Saat ini, telah banyak tes kepribadian yang dikembangkan. Edwards

Personal Preference Schedule (EPPS), Sixteen Personality Factor (16PF), PAPI

Kostick, dan masih banyak lagi. Beberapa tes psikologi tersebut sudah pernah diadaptasi dan digunakan di Indonesia. Pada penelitian ini, peneliti akan menggunakan salah satu dari beberapa tes kepribadian tersebut, yaitu Edwards

Personal Preference Schedule (selanjutnya akan disebut EPPS). Berdasarkan

pengamatan peneliti, EPPS digunakan ketika perusahaan ingin menempatkan calon peserta pada posisi yang tersedia. Unit P3M Fakultas Psikologi USU memakai EPPS sejak tahun 1999 hingga sekarang (Komunikasi personal dengan ketua Unit P3M Fakultas Psikologi USU Ferry Novliadi, 19 Desember 2013).

EPPS adalah tes kepribadian yang dikembangkan oleh Allen L. Edwards. EPPS dikembangkan dengan berdasar pada teori Henry A. Murray mengenai sistem kebutuhan manusia. EPPS yang dikonstrak pada tahun 1953 berbentuk inventori kepribadian. Tujuan EPPS dikonstrak adalah untuk mengungkap kebutuhan-kebutuhan (needs) seseorang. EPPS yang digunakan di Indonesia saat


(19)

ini diadaptasi oleh Lembaga Pengembangan Sarana Pengukuran dan Pendidikan Psikologi Fakultas Psikologi Universitas Indonesia (LPSP3 UI).

Sampai saat ini, EPPS yang digunakan di Indonesia belum pernah direvisi. Seiring berjalannya waktu, setiap alat tes harus diuji kelayakan, diantaranya validitas konstrak dan reliabilitas. Alat tes memiliki validitas yang baik ketika hasil pengukuran tes didukung bukti-bukti yang empiris dan teori-teori yang rasional. Sedangkan, alat tes memiliki reliabilitas yang tinggi ketika hasil dari alat tes yang digunakan dapat dipercaya.

Berdasarkan penelitian Piedmont, McCrae, dan Costa (dalam Gregory, 2004), validitas dan reliabilitas yang dihasilkan EPPS tergolong memiliki nilai yang baik, yaitu korelasi antara kebutuhan aggressive EPPS dengan Neuroticism NEO-PI memiliki nilai .47 dan korelasi antara kebutuhan aggressive EPPS dengan Aggreeableness NEO-PI sebesar -.53, yang menunjukkan validitas konvergen dan diskriminan yang baik. Berdasarkan penelitian Kaplan dan Saccuzzo (2005), reliabilitas EPPS berkisar .60 hingga .87 dari 15 kebutuhan yang diungkap EPPS. Walaupun tergolong baik, validitas dan reliabilitas tersebut diukur pada tahun 1992 dan 2005. Selain itu, sampai sekarang, peneliti juga belum menemukan penelitian yang meneliti validitas dan reliabilitas EPPS di Indonesia.

Bila dilihat dari aitem-aitem EPPS, maka aitem-aitem yang terdapat dalam EPPS sudah tidak menggunakan bahasa yang digunakaan saat ini. Hal ini dikarenakan bahasa yang digunakan ketika melakukan adaptasi EPPS adalah bahasa pada tahun EPPS diadaptasi. Bahasa yang digunakan EPPS akan berbeda


(20)

5

dengan bahasa yang digunakan saat ini. Hal ini dapat menyebabkan peserta tidak mengerti pernyataan dari inventori yang hendak dijawab (komunikasi personal dengan peserta tes Vilya Sutanto, 14 Desember 2013). Selain itu, peneliti juga mengambil beberapa sampel aitem untuk analisis bahasa. Analisis kualitatif ini dilakukan oleh ahli Bahasa Indonesia yang menunjukkan bahwa sampel aitem-aitem tersebut merupakan kalimat yang tidak efektif. Ketidak efektifan ini berarti pola kalimat dan penggunaan kosakata tidak sesuai dengan tata cara penulisan Bahasa Indonesia. Peserta yang mengikuti tes menggunakan EPPS mungkin saja menjawab sembarangan dan mengakibatkan hasil dari tes tersebut belum tentu merepresentasikan dirinya sendiri.

Faktor eksternal juga dapat mempengaruhi validitas dan reliabilitas alat tes, seperti kebocoran soal (Princen, 2011). Pada saat ini, EPPS telah banyak beredar bebas di website. Peneliti melakukan browsing dengan menggunakan mesin pencari. Dengan mengetik kata kunci ‘Tips Mengerjakan EPPS’, peneliti menemukan banyak website yang mengungkap isi EPPS. Hal – hal yang diungkap adalah cara pengisian EPPS, letak konsistensi EPPS, bahkan cara melakukan skoring EPPS. Hal ini tentu saja juga dapat menyebabkan hasil dari EPPS tidak menggambarkan diri peserta yang mengerjakan EPPS dengan baik.

Melihat EPPS masih terus digunakan di Indonesia tetapi belum pernah direvisi sejak pertama kali diadaptasi, bahasa yang digunakan sudah tidak sesuai dengan perkembangan zaman, dan terdapat kebocoran EPPS di website, timbul pertanyaan peneliti mengenai EPPS. ”Apakah EPPS masih layak digunakan untuk mengukur lima belas manifestasi kebutuhan Murray?”. Meskipun demikian, EPPS


(21)

bisa menjadi alat tes yang berkualitas baik jika hasil pengukurannya masih valid dan reliabel. Namun, sejauh ini peneliti belum menemukan adanya rujukan empiris mengenai kualitas EPPS di Indonesia. Berdasarkan pemaparan di atas, maka perlu dilakukan analisis karakteristik psikometri pada EPPS untuk memastikan apakah tes kepribadian ini masih berfungsi sesuai dengan tujuan EPPS disusun. Baburajan (dalam Kaplan & Saccuzzo, 2005) juga mengatakan perlu melakukan analisis validitas yang lebih jauh terhadap EPPS. Hal ini memicu peneliti untuk mengevaluasi validitas dan reliabilitas EPPS. Karakteristik psikometri yang akan dievaluasi peneliti adalah koefisien reliabilitas dan koefisien validitas berdasarkan struktur internal.

B. Identifikasi Masalah

EPPS yang digunakan di Indonesia masih tetap digunakan hingga saat ini, tanpa adanya revisi. Namun, berdasarkan pengamatan peneliti, EPPS yang digunakan sudah lama tidak direvisi, yang menyebabkan validitas dan reliabilitas dari EPPS perlu dipertanyakan. Selain belum pernah direvisi, bahasa yang digunakan EPPS merupakan bahasa yang digunakan pada saat EPPS diadaptas. Hal ini dapat mempengaruhi kognitif peserta EPPS yang mungkin bingung ketika mengisi EPPS. Kebocoran alat tes juga dapat terjadi ketika EPPS sudah lama tidak direvisi. Ketika alat tes yang digunakan sudah tersebar di mana-mana, secara tidak langsung, orang-orang yang hendak mengerjakan EPPS akan mempelajari alat tes tersebut sebelumnya. Hal ini mengakibatkan alat tes menjadi tidak valid dan tidak reliabel untuk mengukur lima belas manifestasi kebutuhan Murray. Jadi,


(22)

7

pada penelitian ini, peneliti akan mengevaluasi bukti validitas berdasarkan struktur internal dan reliabilitas EPPS.

C. Rumusan Masalah

Masalah dalam penelitian ini dirumuskan dalam bentuk pertanyaan penelitian, yaitu:

1. Seberapa besarkah nilai reliabilitas EPPS untuk mengukur manifestasi kebutuhan Murray?

2. Apakah EPPS memiliki bukti validitas berdasarkan struktur internal yang baik?

D. Tujuan Penelitian

Tujuan dari penelitian ini adalah untuk melihat apakah EPPS masih berfungsi sesuai dengan tujuan EPPS dikonstrak, dengan mengevaluasi reliabilitas dan bukti validitas berdasarkan struktur internal EPPS.

E. Manfaat Penelitian

Penelitian ini diharapkan akan bermanfaat, baik secara teoritis maupun secara praktis, yaitu:

1. Manfaat Teoritis

Penelitian ini diharapkan dapat memberikan manfaat teoritis dalam bidang Psikologi mengenai karakteristik EPPS, sehingga dapat menginformasikan apakah EPPS masih sesuai dengan tujuan alat tes EPPS disusun.


(23)

2. Manfaat Praktis

Penelitian ini diharapkan dapat menjadi bahan pertimbangan bagi psikolog ketika akan menggunakan EPPS untuk mengambil keputusan.


(24)

BAB II

TELAAH PUSTAKA

A. Analisis Karakteristik Psikometri 1. Validitas

a. Pengertian Validitas

Pada tahun 1989, Messick (dalam Osterlind, 2010) mengemukakan bahwa validitas adalah evaluasi yang terintegrasi terhadap sejauh mana kesimpulan atau hipotesis hasil tes didukung oleh bukti-bukti empiris dan alasan-alasan teoritis. Ketika seseorang melakukan validasi suatu tes, orang tersebut berarti memastikan sejauh mana bukti-bukti empiris sejalan dengan kesimpulan atau hipotesis dari hasil tes. Hal tersebut dapat disebut sebagai validity evaluation (Osterlind, 2010). Menurut Cronbach (dalam Azwar, 2003), proses validasi bukan bertujuan untuk melakukan validasi tes, tetapi melakukan validasi terhadap kesimpulan data yang diperoleh. Kesimpulan yang diputuskan harus berdasarkan nilai/hasil tes, serta asumsi-asumsi yang mendukung kesimpulan tersebut.

Teori skor-murni klasik (Azwar, 2003) mengartikan pengertian validitas sebagai sejauh mana skor tampak (observed scores) dapat mendekati nilai skor murni (true scores). Tetapi, skor tampak tidak akan persis sama dengan skor murni kecuali alat ukur tersebut memiliki validitas sempurna atau pengukuran tanpa eror. Sedangkan pada buku Standards, validitas berarti derajat sejauh mana bukti dan teori mendukung interpretasi dari skor tes yang sesuai dengan tujuan tes dikonstrak (American Educational Research Association, dkk. dalam


(25)

Osterlind, 2010). Osterlind (2010) mengungkap tiga aspek dalam validitas. Pertama, validitas itu berarti menginterpretasikan skor tes dalam situasi assesmen tertentu, bukan pada alat ukurnya. Kedua, untuk membangun sebuah validitas, diperlukan proses evaluasi. Ketiga, validitas juga berarti mengeksplorasi bagian psikologi.

b. Sumber Bukti Validitas

Ada beberapa sumber bukti validitas yang dikemukakan Osterlind (2010), yaitu bukti validitas berdasarkan:

1) Isi/Konten Tes

Mengevaluasi bukti validitas dari skor tes biasanya selalu menggunakan informasi mengenai konten dari tes. Hal yang dimaksud adalah content

domain (dalam tes berbasis domain), atau construct (dalam tes yang

mengungkap sifat-sifat laten). Walaupun orang yang mengkonstrak tes seharusnya membuat deskripsi atau informasi mengenai konstrak tes, kebanyakan orang tidak menjelaskannya secara detail. Padahal, informasi-informasi tersebut (misalnya informasi-informasi mengenai fungsi alat tes) sangat membantu dalam mempertimbangkan konten tes.

Namun, ada beberapa pertimbangan untuk konstrak tes yang bersifat psikologis, terutama pada tes psikologi yang tidak boleh mengungkap informasi secara langsung. Agar dapat lebih mudah membuat konstrak tes, biasanya blueprint digunakan. Dengan blueprint alat tes, evaluasi validitas dapat menjadi lebih jelas dan teliti. Blueprint tersebut kemudian akan


(26)

11

2) Proses Merespon

Bukti validitas juga bisa didapat dari proses kognitif (merespon) subjek, yaitu apakah subjek menjawab pertanyaan dari tes berdasarkan pemahaman yang sesuai dengan tes. Proses respon dapat dievaluasi dengan menggunakan metode latent variable analyses, structural equation modeling (SEM),

hierarchical linear modeling (HLM), conjectural analysis, path analysis, dan

beberapa tipe dari meta-analyses. Selain itu, metode Taxonomy Bloom juga dapat digunakan. Tetapi, dalam melakukan evaluasi menggunakan metode ini, perlu hati-hati juga karena evaluasi proses respon peserta juga dapat menjadi cara yang mudah dan tidak tepat.

3) Struktur Internal

Mengevaluasi struktur internal dari suatu tes berarti mengevaluasi validitas secara keseluruhan. Struktur internal ini sama dengan validitas konstrak. Struktur internal tes tertuju pada pembuatan kesimpulan yang tepat dan reliabel mengenai konstrak yang dievaluasi. Biasanya struktur internal tes dievaluasi dengan mengevaluasi teori-teori dasar yang berhubungan dengan tes. Teori yang dikonstrak dengan baik akan menyediakan dasar yang lebih baik untuk pengembangan konstrak. Ketika teori diungkap dengan jelas, aitem-aitem tes cenderung akan dikonstrak lebih baik lagi. Lebih jauh lagi, ketika teori yang mendasari fokus pada satu dimensi, menentukan konstrak tes untuk evaluasi dapat lebih teliti. Dengan kata lain, metode psikometri tersedia untuk mengevaluasi struktur internal tes.


(27)

penggunaannya dan informasi apa yang akan diungkap dari tes. Untuk mengevaluasi struktur internal, terdapat metode-metode psikometris, yaitu: a) Model Faktor Umum (Common Factor Model)

Salah satu metode yang digunakan dalam model ini adalah Factor

Analysis (analisis faktor). Analisis faktor digunakan ketika terdapat

banyak tes yang terlibat, tetapi koefisien reliabilitasnya tidak mudah untuk diinterpretasikan. Metode ini dipengaruhi oleh muatan faktor. Muatan faktor menggambarkan kontribusi/besar muatan varians aitem pada konstrak tes. Semakin besar muatan faktor, semakin besar kontribusi varians aitem. Ketika semua variabel memiliki muatan faktor yang tinggi pada faktor yang dievaluasi dan rendah pada faktor lainnya, maka validitas konstrak akan semakin baik. Demikian juga, hal ini berlaku sebaliknya.

Berdasarkan tujuannya, ada dua cara untuk mengurangi banyak variabel menjadi sedikit, yaitu analisis faktor konfirmatori dan analisis faktor eksploratori. Analisis faktor konfirmatori bertujuan untuk memastikan konstrak atau sifat yang telah disimpulkan di dalam data. Peneliti mengidentifikasi variabel yang tidak sesuai dengan tujuan alat ukur dikonstrak. Hayden, Dixon, Dixon, dan O’Brien (2009) mengatakan bahwa analisis faktor konfirmatori biasanya digunakan untuk menguji hipotesis yang telah dibuat sebelumnya berdasarkan teori atau hasil dari penelitian sebelumnya. Sedangkan analisis faktor eksploratori bertujuan untuk memeriksa data baru dengan memadukan variabel-variabel yang bervariasi. Peneliti mengeksplorasi suatu data untuk melihat apakah ada


(28)

13

analisis faktor konfirmatori digunakan dalam meneliti struktur internal tes, khususnya memastikan dimensi-dimensi dalam tes.

b) Multitrait-multimethod matrix (MTMM)

Metode ini merupakan suatu prosedur untuk menganalisis hubungan antar data atau antar aitem, yang dapat mengungkap bukti validitas untuk dievaluasi. Dengan metode ini, validitas dapat mengevaluasi persamaan dan perbedaan antar data (validitas konvergen dan divergen). Dalam mengevaluasi alat tes, diperlukan tiga tes dengan konstrak yang paralel dan metode assessment yang berbeda-beda.

Ada beberapa pertimbangan dalam menginterpretasi koefisien validitas ini. Pertama, perlunya karakteristik spesifik untuk penarikan kesimpulan. Kedua, koefisien reliabilitas yang dihasilkan harus tinggi. Ketiga, koefisien validitas konvergen harus lebih besar daripada koefisien validitas divergen.

4) Hubungan dengan Variabel Lain

Variabel lain yang dimaksud adalah bukti prediktif dan bukti konkuren. Bukti prediktif adalah indikator yang diambil dari perbandingan antara satu tes dengan kriteria-kriteria untuk administrasi posttest. Dengan kata lain, bukti prediktif akan diuji dengan melihat apakah tes tersebut dapat memenuhi kriteria-kriteria yang diprediksikan untuk posttest (setelah tes diberikan). Sedangkan bukti konkuren diindikasikan dengan perbandingan antara satu tes dengan kriteria-kriteria yang paralel dengan tes tersebut. Dengan alasan-alasan yang jelas, tes lain yang paralel dengan tes yang dievaluasi juga dapat menjadi


(29)

Meskipun validitas yang berhubungan dengan kriteria sudah menjadi sumber bukti untuk evaluasi validitas, masih belum ada perbedaan dalam penggunaan bukti prediktif dan konkuren, karena sampai sekarang tidak ada masalah ketika satu validitas lebih kuat dari validitas lain.

5) Pertimbangan Eksternal

Faktor eksternal yang menjadi bukti validitas adalah face validity atau validitas tampang. Seorang subjek yang pertama kali melihat suatu alat tes tidak boleh dihadapkan pada hal-hal yang tidak biasa, karena dapat menyebabkan validitas tidak baik. Untuk menguji validitas tampang, metode statistika tidak dapat digunakan. Selain validitas tampang, ada juga validitas generalisasi yang melihat apakah bukti validitas kriteria dapat digeneralisasikan pada situasi baru tanpa menguji validitas tersebut lagi.

c. Interpretasi Validitas

Nilai yang menentukan ada tidaknya hubungan antara hasil alat ukur dengan kriteria lain yang berhubungan dengan pengukuran disebut koefisien validitas (Osterlind, 2010). Koefisien validitas biasanya diberitahu ketika melakukan evaluasi validitas. Namun, perlu diingat bahwa koefisien validitas hanya berlaku pada situasi tes diberikan dan belum tentu berlaku pada situasi lainnya.

Selain koefisien validitas, konsep yang tidak bisa lepas dari konsep koefisien validitas adalah Standard Error of the Estimate (SEE). SEE adalah indikasi ketidak akuratan prediksi dari skor tes (Osterlind, 2010). Konsep ini sama


(30)

15

(Azwar, 2003). Alat ukur yang memiliki koefisien validitas yang tinggi akan memiliki nilai SEM yang kecil (Azwar, 2003). Skor yang diperoleh dari alat ukur tidak jauh berbeda dari skor sesungguhnya (true scores). Namun, tidak mudah untuk mendapatkan koefisien validitas yang tinggi, terutama validitas pada alat ukur yang mengungkap sifat laten. Selain itu, pada kenyataannya, koefisien validitas tidak akan pernah mencapai atau mendekati angka 1,0.

2. Reliabilitas

a. Pengertian Reliabilitas

Reliabilitas merujuk pada keakuratan pengukuran dalam menilai kemampuan atau kepribadian individu (Osterlind, 2010). Keakuratan suatu pengukuran ditentukan dengan konsistensi hasil pengukuran dari berbagai penilaian. Semakin konsisten hasil pengukuran, semakin baik reliabilitasnya. Konsep yang dilihat reliabilitas adalah seberapa baik salah satu stimulus (misalnya aitem) pada alat ukur menggambarkan stimulus secara keseluruhan alat ukur. Menurut Coaley (2010), suatu alat ukur harus memiliki konsistensi, sehingga hasil alat ukur dari satu subjek memiliki nilai yang relatif tidak berbeda setiap kali alat ukur digunakan. Tetapi, tidak ada alat ukur yang benar-benar akurat.

b. Metode Estimasi Reliabilitas

Sebelum melakukan uji koefisien reliabilitas, pertama-tama kita harus menentukan metode yang akan digunakan dalam melakukan estimasi reliabilitas.


(31)

Ada beberapa metode yang digunakan dalam melakukan estimasi reliabilitas yaitu:

1) Metode Tes-Ulang

Asumsi dalam metode tes-ulangadalah tes yang sama digunakan pada peserta tes yang sama pada rentang waktu yang berbeda dan menggunakan administrasi yang sama (Osterlind, 2010). Ketika tes digunakan dua kali, koefisien reliabilitas yang paralel akan terpenuhi. Tenggang waktu menjadi hal yang sangat penting dalam tes-ulang, karena mempengaruhi reliabilitas (Coaley, 2010). Tetapi, metode tes-ulang memiliki beberapa kelemahan. Peserta tes cenderung akan berubah dalam beberapa aspek (misalnya pada sifat) di antara sesi tes. Hal ini dapat menyebabkan eror karena adanya tenggang waktu, yang rentan pada pengukuran perilaku yang cenderung berubah karena perubahan waktu (Azwar, 2003). Metode tes-ulang juga terkesan kurang praktis karena tester harus kembali menghubungi peserta tes untuk mengikuti tes selanjutnya (Coaley, 2010).

2) Metode Bentuk Paralel dan Bentuk Alternatif

Asumsi dari metode bentuk paralel adalah mengembangkan tes yang memiliki aitem yang ekuivalen, misalnya indeks kesukaran aitem setara. Korelasi di antara kedua tes tersebut kemudian akan digunakan untuk mengestimasi reliabilitas tes. Dengan menggunakan metode ini, efek carry-over akan berkurang karena menggunakan dua tes yang berbeda. Rentang waktu antara tes pertama dan tes kedua juga tidak menjadi peranan penting. Walaupun begitu, mengembangkan bentuk tes yang paralel sangat sulit dan memerlukan


(32)

17

dengan tes yang akan dievaluasi. Sesuai dengan apa yang dikemukakan Osterlind (2010), kesulitan penggunaan pengukuran yang paralel adalah mengidentifikasi pengukuran dengan tepat (ekuivalen terhadap tes yang akan dievaluasi). Hal ini yang menyebabkan metode bentuk alternative muncul. Namun, metode ini memiliki kesamaan, yaitu menggunakan alat ukur lain sebagai pembanding. Hal yang membedakan antara metode bentuk alternatif dan metode bentuk paralel adalah cara mendapatkan alat ukurnya. Metode bentuk paralel menggunakan alat ukur yang dikembangkan sendiri, sedangkan metode bentuk alternatif tidak.

3) Metode Konsistensi Internal

Cara lain yang dapat digunakan ketika tidak ada bentuk alternatif tes lain adalah dengan menggunakan metode konsistensi internal. Metode ini digunakan dengan membagi tes menjadi n bagian (n ≥ 2). Ketika tes dibagi menjadi dua, asumsi yang didapat adalah kedua tes yang dibelah ekuivalen.

Menurut O’Connor (dalam Javali, Gudaganavar, & Shodan, 2011), semakin homogen atau ekuivalen aitem-aitem dalam belahan tes, semakin tinggi reliabilitasnya. Metode ini disebut sebagai metode split-half. Administrasi tes dilakukan satu kali saja, sehingga menghemat waktu. Selain itu, efek

carry-over dapat diminimalisir. Biasanya masalah yang muncul terdapat pada tes

(misalnya korelasi antar belahan tes rendah), tidak pada peserta tes.

Cara pembelahan tes tergantung pada jenis dan fungsi tes yang bersangkutan (Azwar, 2003). Cara pembelahan tes yang dipilih akan menentukan formula apa yang akan digunakan untuk menghitung koefisien


(33)

a) Pembelahan Cara Random

Pembelahan cara random dapat dilakukan dengan mengambil beberapa aitem secara acak untuk dimasukkan ke belahan pertama dan belahan kedua. Namun, perlu diingat bahwa pembelahan cara random hanya dapat digunakan jika tes yang dibelah memiliki aitem yang homogen, baik dari segi isi maupun dari segi kesukaran aitem.

b) Pembelahan Ganjil Genap

Pembelahan ganjil genap dapat dilakukan dengan mengambil aitem-aitem bernomor ganjil dimasukkan ke belahan pertama dan aitem-aitem bernomor genap dimasukkan ke belahan kedua. Pembelahan cara ini digunakan dengan asumsi apabila aitem-aitem yang disusun dalam suatu tes memiliki urutan-urutan tertentu, seperti kesukaran aitem, sehingga setelah tes dibelah, setiap belahan memiliki isi yang setara.

c) Pembelahan Matched-Random Subsets

Pembelahan matched-random subsets digunakan pada tes yang telah diukur tingkat kesukaran aitem dan korelasi antar aitem tes. Aitem-aitem tersebut kemudian dimasukkan ke dalam grafik kartesius dengan sumbu x untuk koefisien korelasi antar aitem dan sumbu y untuk indeks kesukaran aitem. Dengan meletakkan aitem-aitem tersebut, dapat dilihat aitem-aitem yang berdekatan memiliki tingkat setara, sehingga ketika dibelah, belahan pertama dan belahan kedua memiliki tingkat setara.


(34)

19

c. Formula Estimasi Koefisien Reliabilitas

Pada metode konsistensi internal, terdapat beberapa formula (rumus) yang digunakan dalam mengestimasi koefisien reliabilitas, yaitu Formula Spearman-Brown, Koefisien Reliabilitas Kuder-Richardson, dan Koefisien Alpha.

1) Formula Spearman-Brown

Asumsi pemakaian formula ini adalah ketika tes dibagi dua secara random, kedua belahan harus memiliki distribusi normal dengan mean dan standard

deviation yang setara (Azwar, 2003). Umumnya, cara pembelahan tes

dilakukan dengan pembelahan ganjil genap atau matched-random subsets. Perlu diingat bahwa formula ini dipakai ketika korelasi antar kedua belahan tes memiliki nilai yang tinggi. Jika tidak, koefisien reliabilitas yang dihasilkan cenderung memiliki nilai yang rendah (underestimasi). Rumus Spearman-Brownadalah:

··· (1) Keterangan:

koefisien reliabilitas

koefisien antara kedua belahan tes 2) Koefisien Reliabilitas Kuder-Richardson

Ketika tes tidak dapat dibelah menjadi dua belahan sama besar (karena aitem dalam tes sedikit), maka formula ini dapat digunakan. Pembelahan tes dilakukan dengan membelah sebanyak jumlah aitem. Ada 2 rumus Kuder-Richardson, yaitu:


(35)

··· (3) Keterangan:

= proporsi populasi yang menjawab aitem benar (atau aitem pertama). = proporsi populasi yang menjawab aitem salah (atau aitem kedua). = banyak aitem dalam tes.

= varians skor tes. = mean dari tes.

Rumus muncul karena rumus cenderung menghasilkan

komputasi yang lebih panjang (karena menggunakan korelasi antar aitem), sedangkan rumus hanya menggunakan nilai mean (Osterlind, 2010). Namun, rumus cenderung menghasilkan koefisien reliabilitas yang lebih rendah daripada rumus .

3) Koefisien Alpha

Ketika belahan tes yang dikorelasikan belum tentu memenuhi asumsi paralel, koefisien Alpha dapat digunakan. Tetapi, jika asumsi paralel tidak dapat terpenuhi, estimasi reliabilitas cenderung underestimasi. Jadi, ketika alat ukur memiliki koefisien reliabilitas yang cukup tinggi, akan ada kemungkinan koefisien reliabilitas yang lebih tinggi bisa dicapai. Tetapi, jika alat ukur memiliki koefisien reliabilitas yang rendah, akan ada kemungkinan bahwa reliabilitas alat ukur tersebut rendah atau asumsi ekuivalen tidak terpenuhi (Allen & Yen dalam Azwar, 2003).


(36)

21

Koefisien Alpha dapat dipakai ketika tes dibelah dua, tiga, hingga sebanyak jumlah aitem, dengan asumsi ekuivalen terpenuhi. Rumus koefisien Alpha yang digunakan adalah:

··· (4) Keterangan:

= banyak aitem dalam tes. = varians skor tes.

d. Faktor – Faktor yang Mempengaruhi Reliabilitas

Menurut Osterlind (2010), terdapat tiga faktor yang mempengaruhi hasil reliabilitas, yaitu:

1) Efek atenuasi

Koefisien reliabilitas tidak pernah kurang dari koefisien validitas. Karena itu, jika koefisien reliabilitas rendah, koefisien validitas juga akan rendah. Rendahnya koefisien validitas yang disebabkan oleh rendahnya koefisien reliabilitas disebut efek atenuasi (Azwar, 2003).

2) Efek dari panjang tes pada estimasi reliabilitas

Semakin banyak aitem dalam suatu tes, semakin tinggi koefisien reliabilitas. Aitem-aitem yang membentuk tes memiliki karakteristik-karakteristik tertentu yang dibentuk menjadi satu tes. Sehingga semakin banyak aitem yang menggambarkan karakteristik tersebut, akan semakin rinci gambaran konstruk seutuhnya. Jumlah aitem yang diperlukan agar mencapai nilai reliabilitas yang baik adalah lebih dari lima puluh aitem (Javali, dkk., 2011).


(37)

3) Heterogenitas kelompok

Semakin bervariasi kelompok dalam suatu tes, semakin tinggi koefisien reliabilitasnya. Hal ini dikarenakan kelompok yang memenuhi asumsi heterogenitas cenderung memiliki pilihan-pilihan aitem yang berbeda-beda pula. Sedangkan, ketika setiap orang memiliki pilihan-pilihan aitem yang sejenis (tidak ada perbedaan), maka alat ukur tersebut memiliki koefisien reliabilitas 0,0 (Murphy & Davidshofer, 1994).

e. Hubungan Reliabilitas dan SEM

SEM muncul karena reliabilitas alat ukur tidak dapat menggambarkan secara tepat apakah interpretasi hasil alat ukur benar-benar merepresentasikan subjek yang mengikuti tes. SEM adalah indikator yang melihat adanya perbedaan skor tampak dan skor murni (Osterlind, 2010). Konsep SEM muncul karena dalam pengukuran bisa saja terjadi eror. Dengan adanya konsep ini, dapat diketahui bahwa tingginya reliabilitas hasil alat ukur menunjukkan sedikitnya eror yang dihasilkan, dan demikian juga sebaliknya (Coaley, 2010). Semakin tinggi nilai SEM, maka koefisien reliabilitas akan semakin rendah.

SEM juga menunjukkan variasi hasil skor tes yang mungkin dicapai karena adanya eror pengukuran (Murphy & Davidshofer, 1994). Dengan adanya SEM, interval kepercayaan dapat dibentuk. Interval kepercayaan digunakan sebagai indikator terhadap seberapa akurat skor murni dari hasil alat ukur. Namun, kelemahan SEM adalah penggunaannya tidak selalu setara pada semua skor tes. Nilai SEM cenderung kecil pada skor ekstrim dan besar pada skor


(38)

rata-23

f. Interpretasi Reliabilitas

Suatu alat ukur dikatakan memiliki reliabilitas yang baik ketika koefisien reliabilitas dari hasil pengukuran alat ukur tinggi. Tetapi, koefisien reliabilitas yang memuaskan tidak dapat ditentukan. Menurut Azwar (2003), hal ini dikarenakan koefisien reliabilitas yang didapat berdasarkan perhitungan hanya merupakan estimasi dari reliabilitas yang sesungguhnya, dan hanya berlaku pada kelompok subjek yang diukur saja. Selain itu, setiap alat ukur memiliki tuntutan tingkat reliabilitas minimal yang berbeda-beda, sehingga interpretasi koefisien reliabilitas alat ukur tidak dapat lepas dari fungsi dan tujuan pengukuran. Murphy & Davidshofer (1994) mengemukakan bahwa reliabilitas yang tinggi diperlukan ketika tes digunakan untuk membuat keputusan terhadap seseorang (misalnya penempatan posisi kerja) dan ketika individu dari kelompok yang setara dikelompokkan ke dalam satu kategori baru. Sedangkan reliabilitas yang rendah diperbolehkan ketika tes yang digunakan hanya sebagai pendahuluan/permulaan dan ketika tes digunakan individu dari populasi random akan dikategorikan ke dalam kelompok-kelompok kecil. Menurut Bartam (dalam Coaley, 2010), tes IQ biasanya memiliki reliabilitas lebih dari 0,9, sedangkan pada tes kepribadian dan inventori memiliki reliabilitas berkisar 0,7 hingga 0,9.

Besarnya sampel yang digunakan juga menjadi faktor penting dalam koefisien reliabilitas. Tidak cukup jika jumlah sampel yang mengikuti tes kurang dari 30 (Coaley, 2010). Kline (dalam Coaley, 2010) juga mengatakan tidak cukup juga jika jumlah sampel kurang dari 100. Nunally (dalam Coaley, 2010) mengatakan jika sampel yang digunakan mencapai 500, maka 95% dapat


(39)

Ketika menginterpretasi koefisien reliabilitas, terdapat dua hal yang perlu dipahami (Azwar, 2003), yaitu:

1) Estimasi reliabilitas tes pada satu kelompok subjek dalam situasi tertentu akan menghasilkan koefisien yang tidak sama pada kelompok subjek lain dalam situasi yang lain.

2) Koefisien reliabilitas hanya mengindikasikan besarnya inkonsistensi skor hasil pengukuran tes, bukan menyatakan sebab-sebab inkonsistensi tersebut secara langsung.

B. Edwards Personal Preference Schedule 1. Sejarah EPPS

EPPS dikonstrak pada tahun 1958 dan direvisi pada tahun 1959 (dalam Indrawati). EPPS dikonstrak untuk mengukur manifestasi kebutuhan yang dibuat oleh Murray (Edwards; Helms; dalam Gregory, 2004). EPPS menggunakan format forced-choice. Testee harus memilih satu dari dua pernyataan yang paling menggambarkan dirinya. Karena adanya masalah social desirability, Edwards memasangkan kalimat yang tidak berhubungan sama sekali. Sehingga, testee dapat merasa tidak nyaman ketika mengerjakan EPPS (Gregory, 2004).

EPPS adalah tes ipsative. Dalam tes ipsative, skor keseluruhan tes selalu sama dalam setiap individu. Ketika ada skor yang lebih tinggi pada satu sub tes, sub tes yang lain akan memiliki skor yang lebih rendah. Selain itu, dalam tes

ipsative, skor tinggi merupakan skor yang relatif, bukan absolut. Maksudnya, skor


(40)

25

2. Manisfestasi Kebutuhan EPPS

Manifestasi kebutuhan yang diungkap Murray (dalam Kaplan & Saccuzzo, 2005) adalah sebagai berikut:

a) Abasement: Untuk menerima tekanan dari luar. Untuk menyerah. Menerima

dilukai, disalahkan, dikritisi, dihukum. Untuk menyerah pada takdir. Untuk mengakui inferioritas, kesalahan, atau kekalahan. Untuk menyalahkan diri sendiri. Mencari dan menikmati rasa sakit, hukuman, penyakit, dan ketidak beruntungan.

b) Achievement: Untuk menyelesaikan sesuatu yang sulit. Untuk menguasai,

memanipulasi, atau mengorganisasi objek, manusia, atau ide. Untuk melakukannya dengan cepat dan mandiri. Untuk mengatasi hambatan dan mencapai tujuan. Untuk menjadi unggul. Untuk melampaui orang lain.

c) Affiliation: Untuk membentuk hubungan pertemanan. Untuk menyapa,

mengikuti, dan tinggal dengan yang lain. Untuk bekerja sama dan berkomunikasi dengan yang lain. Untuk mencintai, untuk masuk dalam kelompok.

d) Aggression:Untuk berkelahi. Untuk memukul, melukai, atau membunuh yang

lain. Untuk menghukum, melawan pertentangan.

e) Autonomy: Untuk mendapatkan kebebasan. Untuk menghindari pengekangan.

Untuk menjadi mandiri dan bebas melakukan apapun.

f) Blamavoidance: Untuk menghindari disalahkan, dikucilkan, atau diberi

hukuman dengan mencegah melakukan perilaku tidak baik. Untuk berperilaku baik dan mematuhi hukum.


(41)

g) Counteraction: Menolak kekalahan dengan berjuang kembali dan membalas. Untuk memilih tugas tersulit. Untuk melindungi harga diri sendiri.

h) Defendance: Untuk melindungi diri sendiri dari disalahkan atau dilecehkan.

Untuk memberikan penjelasan, alasan. Untuk menghindari ditanya terus menerus.

i) Deference: Untuk mengagumi dan mendukung atasan. Untuk memuji dan

menghormati. Untuk menurut pada adat istiadat. Untuk meniru atasan.

j) Dominance: Untuk mempengaruhi atau mengontrol orang lain. Untuk

melarang, untuk mengarahkan orang lain. Untuk mengekang, untuk mengoganisasikan perilaku kelompok.

k) Exhibition: Untuk membuat kesan, untuk dilihat dan didengar. Untuk

menghibur, mengejutkan orang lain.

l) Harmavoidance: Untuk menghindari rasa sakit, luka fisik, penyakit, dan

kematian. Untuk menghindari situasi berbahaya.

m) Infavoidance: Untuk menghindari penghinaan, untuk tidak melecehkan dan

dilecehkan, untuk tidak bertindak karena takut kesalahan.

n) Nurturance: Untuk membantu, atau melindungi orang yang membutuhkan

bantuan. Untuk mengekspresikan simpati.

o) Order: Untuk menyusun sesuatu dalam urutan, untuk mencapai kerapian,

keseimbangan, kebersihan, dan ketelitian.

p) Play: Untuk mencari kesenangan, membahagiakan diri, untuk bermain, untuk ketawa dan bercanda, untuk menghindari tekanan.


(42)

27

s) Sex: Untuk membentuk dan mendapatkan hubungan erotis. Untuk mendapat hubungan seksual.

t) Succorance: Untuk mencari bantuan, perlindungan, atau simpati. Untuk

bergantung dengan orang lain.

u) Understanding: Untuk menganalisis pengalaman, untuk berpikir abstrak,

untuk menggabungkan ide, untuk mendefinisikan hubungan.

Edwards hanya mengambil dan mengembangkan lima belas kebutuhan, yaitu Achievement, Deference, Order, Exhibition, Autonomy, Affection, Intraception,

Succorance, Dominance, Abasement, Nurturance, Change, Endurance,

Heterosexual, dan Aggression.

C. Analisis Karakteristik Psikometri EPPS

EPPS merupakan tes kepribadian yang mengukur manifestasi kebutuhan yang dikemukakan oleh Murray. EPPS saat ini lebih sering digunakan dalam proses seleksi calon karyawan baru dan dalam penentuan treatment untuk klien. Oleh karena itu, sebagai tes seleksi dan tes penentu treatment, EPPS harus memiliki kualitas yang baik. Apabila EPPS tidak memiliki kualitas yang baik, tentu saja proses seleksi dan pemberian treatment menjadi kurang tepat atau bahkan salah.

Kualitas suatu alat tes dapat dilihat dari banyak hal. Reliabilitas dan validitas (dalam hal ini adalah struktur internal) hasil alat tes adalah beberapa dari banyak hal tersebut. Struktur internal suatu alat ukur sangat penting, karena struktur internal menentukan alat tes memang mengukur atribut yang hendak


(43)

EPPS memang menunjukkan manifestasi kebutuhan Murray. Manifestasi kebutuhan yang dikemukakan Murray adalah achievement, deference, order, exhibition, autonomy, affiliation, intraception, succorance, dominance, abasement,

nurturance, change, endurance, heterosexuality, dan aggression. Bukti validitas

berdasarkan struktur internal dikatakan baik ketika nilai muatan faktor aitem di atas 0.50, dengan toleransi paling rendah adalah 0.30 (Azwar, 2003). Sedangkan reliabilitas EPPS yang baik berarti hasil yang diperoleh dari EPPS memang dapat dipercaya. Koefisien reliabilitas yang baik untuk tes kepribadian berkisar antara 0.7 hingga 0.9. Ketika EPPS memiliki reliabilitas yang baik dan didukung bukti validitas berdasarkan struktur internal, maka hasil pengukuran EPPS dapat digunakan untuk bahan pertimbangan untuk pengambilan keputusan.


(44)

BAB III

METODE PENELITIAN

A. Jenis Penelitian

Jenis penelitian yang digunakan adalah penelitian dengan pendekatan kuantitatif dan metode deskriptif. Menurut Creswell (2003), pendekatan kuantitatif adalah pendekatan yang digunakan untuk mengembangkan ilmu pengetahuan (misalnya mencari tahu hubungan sebab akibat antar variabel), menggunakan metode eksperimen atau survei, dan mengumpulkan data dengan alat ukur yang sudah ditentukan sebelumnya yang dilaporkan dalam bentuk data statistik. Metode deskriptif atau survei adalah metode yang menghasilkan deskripsi dalam bentuk angka mengenai sikap, opini, atau kecenderungan perilaku dalam suatu populasi dengan mempelajari sampel dari populasi tersebut (Creswell, 2003). Menurut Arikunto (2010), peneliti tidak mengubah, menambah, ataupun memanipulasi objek atau wilayah penelitian dalam penelitian deskriptif. Penelitian ini akan mendeskripsikan nilai reliabilitas dan bukti validitas berdasarkan struktur internal EPPS.

B. Data yang Digunakan

Data yang digunakan dalam penelitian ini adalah respon dari responden yang mengikuti tes EPPS dalam bentuk lembar jawaban di P3M USU dalam rentang waktu tahun 2010 sampai 2013. Jumlah respon jawaban yang digunakan peneliti adalah sebanyak 954 respon. Respon jawaban peserta diberi skor nol (0)


(45)

melingkari huruf A dan satu (1) jika melingkari huruf B.

C. Pelaksanaan Penelitian

Tahapan yang akan dilakukan peneliti dalam melaksanakan penelitian, yaitu:

1. Pembuatan Proposal

Penelitian dimulai dengan merancang proposal, yang terdiri dari Bab I Pendahuluan, Bab II Telaah Pustaka, dan Bab III Metode Penelitian.

2. Persiapan Izin Penelitian

Peneliti mengurus surat permohonan izin untuk melaksanakan pengambilan data. Surat izin ini diurus di bagian administrasi pendidikan Fakultas Psikologi USU, yang kemudian ditujukan kepada Ketua P3M USU. Setelah surat permohonan izin penelitian dibuat, peneliti mengajukan surat tersebut kepada P3M USU.

3. Analisis Data

Penelitian dilaksanakan ketika seluruh data hasil EPPS yang pernah dilakukan P3M USU telah berhasil dikumpulkan. Data-data tersebut kemudian dimasukkan ke dalam bentuk tabel-tabel di Microsoft Excel. Setelah dimasukkan, data-data tersebut dipindahkan ke lembar kerja Program SPSS dan Program LISREL. Analisis yang dilakukan di Program SPSS adalah analisis reliabilitas skor komposit. Analisis yang dilakukan di Program


(46)

31

D. Metode Pengumpulan Data

Metode pengumpulan data yang digunakan adalah metode dokumentasi. Metode dokumentasi adalah metode yang digunakan dalam pengumpulan data, dengan cara mencari data mengenai variabel melalui catatan, transkrip, buku, surat kabar, majalah, notulen rapat, agenda, dan sebagainya (Arikunto, 2010). Dokumen yang digunakan pada penelitian ini adalah data yang telah didokumentasikan P3M USU. Data tersebut adalah data respon dari responden yang mengikuti EPPS dalam bentuk lembar jawaban.

E. Software yang Digunakan

Peneliti menggunakan bantuan software komputer dalam melakukan analisis data. Software komputer yang akan digunakan peneliti adalah sebagai berikut:

1. Microsoft Excel yang diproduksi oleh Microsoft Corporation yang

diintegrasikan dalam paket Microsoft Office System 2007. Software ini digunakan untuk melakukan proses tabulasi skor EPPS dari dokumen P3M USU.

2. Program SPSS for Windows versi 16.0 yang diproduksi oleh International

Business Machine Corp. Software ini digunakan untuk menganalisis

reliabilitas komposit EPPS.

3. Program LISREL versi 9.1 for Windows Free Trial Edition yang diproduksi oleh Scientific Software International Inc. Software ini digunakan untuk menganalisis bukti validitas berdasarkan struktur internal EPPS. Software ini


(47)

diperoleh dengan mengajukan permohonan penggunaan program LISREL selama 15 (lima belas) hari kepada Scientific Software International Inc., sebagai pemegang lisensi LISREL.

F. Cara Analisis Data

Cara analisis data yang dilakukan peneliti dibagi dalam dua tahap, yaitu: 1. Analisis Reliabilitas

Reliabilitas EPPS diukur dengan menggunakan formula koefisien Alpha: ··· (4)

Keterangan:

= banyak aitem dalam tes. = varians skor tes.

Dilihat dari segi tujuan pengembangan EPPS, reliabilitas EPPS dikatakan baik ketika koefisien reliabilitas EPPS di atas .70. EPPS merupakan alat ukur yang digunakan untuk tujuan prediksi dan diagnosis, sehingga harus memiliki koefisien reliabilitas yang tinggi. Analisis reliabilitas akan dilakukan menggunakan program SPSS for Windows versi 16.0.

EPPS merupakan gabungan dari beberapa sub bagian manifestasi kebutuhan. Oleh karena itu, untuk mengestimasi reliabilitas EPPS, digunakan reliabilitas skor komposit. Reliabilitas skor komposit adalah reliabilitas skor gabungan dari setiap bagian dengan memperhitungkan reliabilitas masing-masing bagian (Azwar, 2003). Reliabilitas skor komposit didapat dengan menambah skor-skor dari beberapa tes yang berbeda (Murphy & Davidshofer, 1994). Dalam hal


(48)

33

ini, tes-tes tersebut adalah 15 sub bagian manifestasi kebutuhan EPPS. Semakin banyak tes digabung, dan semakin tinggi korelasi antar tes, semakin tinggi reliabilitas skor komposit (Murphy & Davidshofer, 1994). Rumus reliabilitas skor komposit adalah:

··· (5) Keterangan:

= reliabilitas skor komposit. = jumlah tes.

= rata-rata reliabilitas tes. = rata-rata korelasi antar tes.

2. Analisis Bukti Validitas Berdasarkan Struktur Internal

Analisis bukti validitas berdasarkan struktur internal dilakukan dengan menggunakan metode analisis faktor. Jenis analisis faktor yang digunakan adalah analisis faktor konfirmatori. Hal ini dikarenakan peneliti hanya memastikan, bukan mengeksplorasi, apakah EPPS masih berfungsi sesuai dengan tujuan EPPS disusun. Analisis bukti validitas dengan menggunakan analisis faktor konfirmatori dilakukan dengan menggunakan program LISREL versi 9.1 for Windows Free

Trial Edition, dengan tahapan-tahapan sebagai berikut (Wijanto, 2008):

a) Spesifikasi Model

Pertama kali yang harus dilakukan adalah menspesifikasikan model penelitian yang akan dianalisis. Instrumen juga disusun berdasarkan variabel-variabel teramati pada model untuk pengumpulan data.


(49)

b) Pengumpulan Data

Pengumpulan data dilakukan dengan melihat data sekunder yang sesuai dengan desain instrumen yang telah dispesifikasikan.

c) Pembuatan program SIMPLIS dan Menjalankannya

Program SIMPLIS dibuat berdasarkan spesifikasi model dan data yang telah dikumpulkan. Program tersebut dijalankan dengan menggunakan program LISREL.

d) Analisis Keluaran Program SIMPLIS

1) Memeriksa offending estimate dari standardized loading factor (λ), seperti

negative error variance < 1.0. Jika tidak memenuhi, tambahkan kalimat

”Set Error Variance of (Nama Variabel) to 0.01” pada program SIMPLIS.

2) Memeriksa validitas model pengukuran dengan melihat nilai t pada

standardized loading factor (λ) dari variabel-variabel teramati dalam

model > 1,96 dan standardized loading factor variabel-variabel teramati ≥ 0.30. Jika tidak memenuhi, variabel tersebut dapat dikeluarkan atau dihapus dari model.

3) Memeriksa uji kecocokan keseluruhan model pengukuran dengan melihat nilai dari ukuran goodness of fit (selanjutnya akan disebut GOF) yang terdiri dari Goodness-of-Fit Index (GFI), Root Mean Square Error of

Approximation (RMSEA), Non-Normed Fit Index (NNFI), Normed Fit

Index (NFI), Adjusted Goodness of Fit (AGFI), dan Comparative Fit


(50)

35

menunjukkan kecocokan yang baik yang sesuai dengan nilai yang disajikan pada Tabel 1.

Tabel 1. Perbandingan Ukuran-Ukuran Goodness of Fit

Ukuran Goodness of Fit

(GOF) Tingkat Kecocokan yang Bisa Diterima

Goodness-of-Fit Index (GFI)

Nilai berkisar antara 0-1, dengan nilai lebih tinggi adalah lebih

baik. GFI ≥ 0.90 adalah good-fit, sedangkan 0.80 ≤ GFI < 0.90 adalah marginal fit.

Root Mean Square Error of Approximation (RMSEA)

Rata-rata perbedaan per degree of freedom yang diharapkan terjadi dalam populasi dan bukan dalam sampel. RMSEA ≤ 0.08 adalah good fit, sedangkan RMSEA < 0.05 adalah close fit. Tucker-Lewis Index atau

Non-Normed Fit Index (TLI atau NNFI)

Nilai berkisar antara 0-1, dengan nilai lebih tinggi adalah lebih baik. TLI ≥ 0.90 adalah good-fit, sedangkan 0.80 ≤ TLI < 0.90 adalah marginal fit.

Normed Fit Index (NFI) Nilai berkisar antara 0-1, dengan nilai lebih tinggi adalah lebih baik. NFI ≥ 0.90 adalah good-fit, sedangkan 0.80 ≤ NFI < 0.90 adalah marginal fit.

Adjusted Goodness of Fit (AGFI)

Nilai berkisar antara 0-1, dengan nilai lebih tinggi adalah lebih baik. AGFI ≥ 0.90 adalah good-fit, sedangkan 0.80 ≤ AGFI < 0.90 adalah marginal fit.

Comparative Fit Index (CFI)

Nilai berkisar antara 0-1, dengan nilai lebih tinggi adalah lebih baik. CFI ≥ 0.90 adalah good-fit, sedangkan 0.80 ≤ CFI < 0.90 adalah marginal fit.


(51)

BAB IV

HASIL DAN PEMBAHASAN

A. Deskripsi Umum Data Penelitian

Penelitian ini menggunakan data sekunder yang merupakan dokumentasi P3M Fakultas Psikologi USU. Data sekunder ini adalah respon dari responden yang mengikuti EPPS yang diperoleh dari lembar jawaban EPPS. Dari 1018 responden, 64 responden tidak menjawab seluruh atiem EPPS. Oleh karena itu, peneliti hanya menggunakan 954 respon dari responden untuk dianalisis.

B. Deskripsi Hasil

1. Analisis Bukti Validitas Berdasarkan Struktur Internal

Analisis bukti validitas berdasarkan struktur internal EPPS dilakukan dengan menggunakan analisis faktor konfirmatori. Analisis ini dilakukan dengan menggunakan program LISREL versi 9.1 for Windows. Sebelum mengevaluasi nilai t dan nilai muatan faktor aitem-aitem pada setiap sub bagian manifestasi kebutuhan EPPS, peneliti harus melakukan uji kecocokan model.

a. Uji Kecocokan Model

Uji kecocokan model dilakukan dengan cara memastikan nilai GOF dari model menunjukkan nilai yang baik. Nilai GOF yang diperoleh dari hasil analisis dengan beberapa modifikasi berdasarkan saran dari program, disajikan pada Tabel 2.


(52)

37

Tabel 2. Nilai GOFEPPS

No Kebutuhan GFI Ket RMSEA Ket NNFI Ket NFI Ket AGFI Ket CFI Ket

1. Achieve. 0,921 GF 0,0654 GF 0,852 MF 0,899 MF 0,852 MF 0,916 GF 2. Deference 0,919 GF 0,0630 GF 0,819 MF 0,868 MF 0,858 MF 0,891 MF 3. Order 0,877 MF 0,0797 GF 0,853 MF 0,880 MF 0,817 MF 0,894 MF 4. Exhibition 0,920 GF 0,0665 GF 0,858 MF 0,905 GF 0,848 MF 0,921 GF 5. Autonomy 0,952 GF 0,0325 CF 0,904 GF 0,858 MF 0,936 GF 0,922 GF 6. Affiliation 0,922 GF 0,0701 GF 0,844 MF 0,903 GF 0,843 MF 0,917 GF 7. Intraception 0,925 GF 0,0615 GF 0,833 MF 0,870 MF 0,874 MF 0,893 MF 8. Succorance 0,879 MF 0,0799 GF 0,845 MF 0,871 MF 0,824 MF 0,886 MF 9. Dominance 0,915 GF 0,0718 GF 0,861 MF 0,908 GF 0,840 MF 0,921 GF 10. Abasement 0,945 GF 0,0375 CF 0,846 MF 0,804 MF 0,927 GF 0,875 MF 11. Nurturance 0,915 GF 0,0790 GF 0,838 MF 0,904 GF 0,826 MF 0,915 GF 12. Change 0,921 GF 0,0742 GF 0,872 MF 0,929 GF 0,825 MF 0,939 GF 13. Endurance 0,912 GF 0,0722 GF 0,859 MF 0,909 GF 0,828 MF 0,922 GF 14. Heterosex. 0,942 GF 0,0732 GF 0,957 GF 0,983 GF 0,813 MF 0,986 GF 15. Aggression 0,917 GF 0,0690 GF 0,892 MF 0,927 GF 0,843 MF 0,938 GF

Keterangan: GF = Good Fit; MF = Marginal Fit; CF = Close Fit

Analisis uji kecocokan model diukur dengan menggunakan 6 (enam) ukuran GOF, yaitu GFI, RMSEA, NNFI, NFI, AGFI, dan CFI. Ukuran-ukuran tersebut dijelaskan dengan 3 (tiga) tingkat GOF, yaitu tingkat kecocokan yang baik (good fit, selanjutnya akan disebut GF), tingkat kecocokan yang cukup

(marginal fit, selanjutnya akan disebut MF untuk ukuran GFI, NNFI, NFI, AGFI,

dan CFI, atau close fit, selanjutnya akan disebut CF untuk ukuran RMSEA), serta tingkat kecocokan yang tidak cukup (not fit, selanjutnya akan disebut NF). Berdasarkan Tabel 4, dapat disimpulkan bahwa:

1) Pada ukuran GFI, terdapat 13 dari 15 sub bagian pada tingkat GF, 2 pada tingkat MF, dan tidak ada satupun pada tingkat NF.

2) Pada ukuran RMSEA, terdapat 13 dari 15 sub bagian pada tingkat GF, 2 pada tingkat CF, dan tidak ada satupun pada tingkat NF.

3) Pada ukuran NNFI, terdapat 2 dari 15 sub bagian pada tingkat GF, 13 pada tingkat MF, dan tidak ada satupun pada tingkat NF.

4) Pada ukuran NFI, terdapat 8 dari 15 sub bagian pada tingkat GF, 7 pada tingkat MF, dan tidak ada satupun pada dengan tingkat NF.


(53)

5) Pada ukuran AGFI, terdapat 2 dari 15 sub bagian pada tingkat GF, 13 pada tingkat MF, dan tidak ada satupun pada tingkat NF.

6) Pada ukuran CFI, terdapat 5 dari 15 sub bagian pada tingkat GF, 10 pada tingkat MF, dan tidak ada satupun pada tingkat NF.

Tidak adanya sub bagian yang memiliki ukuran goodness of fit pada tingkat NF menunjukkan bahwa model pengukuran sudah siap untuk dianalisis nilai t dan nilai muatan faktor aitem-aitem pada setiap sub bagian manifestasi kebutuhan. Analisis nilai GOF EPPS dapat dilihat pada Lampiran 1 halaman 49.

b. Analisis Nilai t dan Nilai Muatan Faktor pada Aitem Setiap Sub Bagian EPPS Setelah melakukan uji kecocokan model, peneliti kemudian memeriksa validitas model pengukuran dengan melihat nilai t dan nilai muatan faktor aitem-aitem pada masing-masing sub bagian manifestasi kebutuhan EPPS. Berdasarkan hasil analisis bukti validitas berdasarkan struktur internal, dapat disimpulkan bahwa:

1. Sub bagian achievement memiliki 58,1% atau 18 dari 31 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 41,9% atau 13 aitem dalam kategori aitem yang valid.

2. Sub bagian deference memiliki 93,5% atau 29 dari 31 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 6,5% atau 2 aitem dalam kategori aitem yang valid.


(54)

39

3. Sub bagian order memiliki 32,2% atau 10 dari 31 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 67,8% atau 21 aitem dalam kategori aitem yang valid.

4. Sub bagian exhibition memiliki 96,8% atau 30 dari 31 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 3,2% atau 1 aitem dalam kategori aitem yang valid.

5. Sub bagian autonomy memiliki 83,9% atau 26 dari 31 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 16,1% atau 5 aitem dalam kategori aitem yang valid.

6. Sub bagian affiliation memiliki 72,4% atau 21 dari 29 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 27,6% atau 8 aitem dalam kategori aitem yang valid.

7. Sub bagian intraception memiliki 65,5% atau 19 dari 29 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 34,5% atau 10 aitem dalam kategori aitem yang valid.

8. Sub bagian succorance memiliki 24,1% atau 7 dari 29 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 75,9% atau 22 aitem dalam kategori aitem yang valid.

9. Sub bagian dominance memiliki 48,3% atau 14 dari 29 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 51,7% atau 15 aitem yang termasuk dalam kategori aitem yang valid.


(55)

10.Sub bagian abasement memiliki 75,9% atau 22 dari 29 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 24,1% atau 7 aitem dalam kategori aitem yang valid.

11.Sub bagian nurturance memiliki 36,7% atau 11 dari 30 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 63,3% atau 19 aitem dalam kategori aitem yang valid.

12.Sub bagian change memiliki 70% atau 21 dari 30 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 30% atau 9 aitem dalam kategori aitem yang valid.

13.Sub bagian endurance memiliki 43,3% atau 13 dari 30 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 56,7% atau 17 aitem dalam kategori aitem yang valid.

14.Sub bagian heterosexual memiliki 6,7% atau 2 dari 30 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 93,3% atau 28 aitem dalam kategori aitem yang valid.

15.Sub bagian aggression memiliki 46,7% atau 14 dari 30 aitem yang termasuk dalam kategori aitem yang tidak valid, dan 53,3 atau 16 aitem dalam kategori aitem yang valid.

c. Analisis Aitem EPPS

Berdasarkan analisis nilai t dan muatan faktor aitem pada setiap sub bagian EPPS, maka aitem yang termasuk dalam kategori tidak valid berjumlah 117 dari 225 aitem atau 78,7%, sedangkan aitem yang termasuk dalam kategori


(56)

41

valid berjumlah 48 aitem atau 21,3%. Rangkuman jumlah keseluruhan aitem yang termasuk dalam kategori tidak valid dan valid disajikan di dalam Tabel 3.

Tabel 3. Rangkuman Kategorisasi Aitem Tidak Valid dan Valid

No.

Kate-gori Aitem

Total (Persen)

1. Tidak Valid

1, 2, 3, 4, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 17, 18, 19, 20, 22, 23, 24, 25, 27, 29, 30, 31, 32, 34, 37, 39, 41, 42, 43, 44, 45, 46,47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 59, 60, 61, 62, 63, 64, 65, 66, 67, 69, 70, 71, 72, 74, 75, 76, 77, 79, 80, 81, 82, 83, 84, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 115, 116, 117, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 130, 131, 132, 133, 134, 135, 137, 139, 140, 141, 143, 145, 146, 148, 149, 153, 155, 156, 157, 158, 162, 163, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 179, 180, 181, 182, 183, 186, 187, 189, 190, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 206, 207, 209, 210, 211, 213, 215, 216, 217, 218, 219, 220, 221, 222, 224, 225.

177 (78,7%)

2. Valid 5, 16, 21, 26, 28, 33, 35, 36, 38, 40, 58, 68, 73, 78, 86, 88, 89, 101, 113, 114, 118, 129, 136, 138, 142, 144, 147, 150, 151, 152, 154, 159, 160, 161, 164, 178, 184, 185, 188, 191, 202, 203, 204, 205, 208, 212, 214, 223.

48 (21,3%)

2. Analisis Reliabilitas

Estimasi koefisien reliabilitas EPPS dalam penelitian ini dihitung dengan menggunakan koefisien reliabilitas skor komposit, dengan pendekatan konsistensi internal dengan formula koefisien Alpha. Hasil analisis reliabilitas skor komposit (rss) EPPS adalah 0,89. Analisis reliabilitas skor komposit dapat dilihat pada

Lampiran 2 halaman 65.

C. Pembahasan

EPPS adalah alat tes kepribadian yang masih digunakan untuk keperluan perekrutan dan kebutuhan klinis. Oleh karena itu, hasil pengukuran EPPS harus valid dan reliabel untuk mengukur lima belas manifestasi kebutuhan Murray. Dari hasil analisis bukti validitas berdasarkan struktur internal, ditemukan bahwa 78,7% aitem-aitem EPPS merupakan aitem yang tidak valid dan 21,3% aitem yang valid untuk mengungkap kelima belas manifestasi kebutuhan Murray.


(57)

Melihat hasil analisis bukti validitas berdasarkan struktur internal yang buruk pada 78,7% aitem EPPS, hal ini dapat disebabkan karena lamanya EPPS tidak direvisi, bahasa yang digunakan kurang dimengerti peserta tes, dan kebocoran EPPS di website.

Berdasarkan analisis kualitatif, aitem-aitem EPPS relatif panjang. Masing-masing pernyataan pada aitem-aitem EPPS rata-rata memiliki 14 kata. EPPS yang tidak pernah disajikan sendiri tanpa alat tes lainnya dapat menyebabkan kelelahan dan kejenuhan bagi peserta yang mengikuti EPPS. Selain itu, struktur pernyataan yang dibentuk tidak sesuai dengan kaidah penulisan aitem. Aitem dengan kualitas yang baik harus berpedoman pada kaidah penulisan (Azwar, 2013). Aitem pada kategori tidak valid memiliki pernyataan yang tidak efektif, serta mengandung penafsiran ganda dan social desirability yang tinggi. Misalnya pada aitem 7B, 15A, 31B, 48B, 57A, 92A, dan 108B memiliki aitem yang pernyataannya tidak efektif karena pertanyaannya panjang, menggunakan kosa kata yang sudah tidak dipakai saat ini, serta tata bahasa Indonesia yang digunakan tidak baku. Sedangkan pada aitem 25A, 27B, 73B, 79A, 84B, 98B, dan 112A memiliki aitem yang pernyataannya mengandung penafsiran ganda. Aitem yang memiliki social

desirability yang tinggi serta tidak valid adalah 65A dan 172B.

Berdasarkan pengamatan peneliti, ada beberapa website yang mengungkap isi dari EPPS, yaitu:

1. http://soalpsikotest.com/apa-dan-bagaimana-soal-epps-pada-psikotes/. Website tersebut menjelaskan kebutuhan-kebutuhan apa yang diungkap dari EPPS dengan penjelasan pada setiap kebutuhan. Selain itu, website tersebut


(58)

43

memberikan tips pengerjaan EPPS dengan baik serta memberikan gambar lembar jawaban EPPS.

2. http://nurul_q.staff.gunadarma.ac.id/Downloads/files/35115/EPPS.doc. Ketika mengunduh file dari website tersebut, peneliti dapat melihat tujuan pengukuran dari EPPS, instruksi tes EPPS, cara melakukan skoring, serta interpretasi konsistensi dan penjelasan setiap kebutuhan. Meskipun file ini digunakan untuk kepentingan perkuliahan, tetapi sebaiknya website ini dikunci untuk kalangan sendiri. Sehingga file ini tidak dapat diunduh oleh orang luar.

Penyebab-penyebab tersebut dapat menjadi faktor buruknya bukti validitas berdasarkan struktur internal EPPS. Tetapi, belum ada bukti empiris yang dapat menunjukkan faktor buruknya bukti validitas berdasarkan struktur internal. Oleh sebab itu, masih diperlukan studi-studi lebih lanjut untuk memastikan apakah buruknya validitas disebabkan oleh penyebab-penyebab tersebut.

Berdasarkan hasil analisis reliabilitas, didapatkan nilai koefisien reliabilitas skor komposit EPPS adalah sebesar 0,89. Bartam (dalam Coaley, 2010) mengatakan bahwa reliabilitas yang baik pada tes kepribadian adalah berkisar 0,7 hingga 0,9. Hal ini mengindikasikan bahwa hasil pengukuran EPPS dapat dipercaya.

Secara keseluruhan, EPPS merupakan alat tes yang reliabel, tetapi tidak valid untuk mengukur lima belas manifestasi kebutuhan EPPS. Menurut Huitt (dalam Universitas Pendidikan Indonesia, 2008), alat ukur yang reliabel bisa jadi pengukurannya tidak valid. Konsep ini sejalan dengan apa yang dikatakan


(59)

Osterlind (2010) bahwa reliabilitas tidak cukup untuk membuat kesimpulan terhadap validitas. Ketika reliabilitas melihat konsistensi hasil pengukuran, validitas melihat konsistensi dari variabel laten yang diungkap dengan menggunakan aitem. Dengan kata lain, ketika hasil pengukuran suatu alat ukur adalah reliabel tetapi tidak valid, maka hasil pengukuran tersebut memiliki konsistensi yang baik untuk mengungkap variabel laten yang tidak seharusnya diungkap. Oleh karena itu, hasil analisis reliabilitas yang baik dengan hasil analisis bukti validitas berdasarkan struktur internal yang buruk ini dapat terjadi. Pada penelitian ini, hasil pengukuran EPPS memiliki tingkat konsistensi yang tinggi untuk mengukur variabel laten lainnya, bukan lima belas manifestasi kebutuhan Murray.


(60)

BAB V

KESIMPULAN DAN SARAN

A. Kesimpulan

Berdasarkan hasil penelitian mengenai analisis karakteristik psikometri EPPS, disimpulkan bahwa hasil pengukuran EPPS dapat dipercaya, tetapi hasil pengukuran dengan menggunakan EPPS tidak valid untuk mengukur kelima belas manifestasi kebutuhan Murray.

B. Saran

Berdasarkan hasil penelitian, berkaitan dengan penggunaan EPPS, sebaiknya mempertimbangkan beberapa saran berikut ini:

1. Saran Praktis

a. Untuk kepentingan pengambilan keputusan yang sangat penting, sebaiknya EPPS tidak dipakai untuk mengungkap kepribadian mengenai lima belas manifestasi kebutuhan Murray.

2. Saran Metodologi

a. Peneliti selanjutnya sebaiknya menganalisis penyebab banyaknya modifikasi model pengukuran LISREL oleh karena varians eror antar aitem EPPS.


(61)

DAFTAR PUSTAKA

Arikunto, S. (2010). Prosedur penelitian: Suatu pendekatan praktik. Jakarta: PT Rineka Cipta.

Azwar, S. (2003). Reliabilitas dan validitas (Edisi ke-3). Yogyakarta: Pustaka Pelajar.

Azwar, S. (2013). Penyusunan skala psikologi (Edisi 2). Yogyakarta: Pustaka Belajar.

Coaley, K. (2010). An introduction to psychological assessment and

psychometrics. London: Sage Publication Ltd.

Creswell, J. W. (2003). Research design: Qualitative, quantitative, and mixed

methods approaches (Second Edition). London: Sage Publication Ltd.

Gregory, R. J. (2004). Psychological testing: history, principles, and application

(Fourth edition). United States of America:Pearson Education, Inc.

Hayden, M. J., Dixon, J. B., Dixon, M. E., O’Brien, P. E. (2009). Confirmatory

factor analysis of the beck depression inventory in obese individuals seeking surgery. Obes Surg, 20:432–439.

Humanika Consulting. (2014). Assessment program. [Online].

www.humanikaconsulting.com/web/services/assessment.html. Diakses pada tanggal 20 Desember 2013.

Indrawati, S. W. (Tanpa Tahun). Tes psikologi (Tes EPPS). [Online]. http://file.upi.edu/Direktori/FIP/JUR._PSIKOLOGI/195010101980022-SITI_WURYAN_INDRAWATI/TES_EPPS.pdf. Diakses pada tanggal 21 Januari 2014.

Javali S. B., Gudaganavar N. V., & Shodan MJ. (2011). Effect of varying sample size in estimation of reliability coefficients of internal consistency.

WebmedCentral, 2(2).

Kaplan, R. M. & Saccuzzo D. P. (2005). Psychological testing: principles,

applications, and issues (Sixth edition). Belmont: Thomson Wadsworth.

Murphy, K. R. & Davidshofer, C. O. (1994). Psychological testing: principles and


(1)

47

Novliadi, Ferry. (Komunikasi personal, 19 Desember 2013). Informasi mengenai kapan EPPS digunakan di unit P3M fakultas psikologi USU.

Osterlind, S. J. (2010). Modern measurement: Theory, principles, and applications of mental appraisal (Second edition). United States of America: Pearson Education, Inc.

Pervin, L., Cervone, D., & Oliver, J. (2005). Personality: theory and research (Ninth edition). United States of America: John Wiley & Sons, Inc.

Princen. (2011). Karakteristik psikometri subtes zahlenreihen (ZR) pada intelligenz struktur test (IST). Skripsi. Medan: Universitas Sumatera Utara. Sutanto, Vilya. (Komunikasi personal, 14 Desember 2013). Informasi mengenai

bahasa yang digunakan di EPPS.

Universitas Pendidikan Indonesia. (2008). Pengukuran, penilaian, dan tes. [Online].

http://file.upi.edu/Direktori/FIP/JUR._PSIKOLOGI/197509122006041-HELLI_IHSAN/Pengertian_Pengukuran.pdf. Diakses pada tanggal 30 Juni 2014.

Wijanto, S. H. (2008). Structural equation modeling dengan lisrel 8.8. Yogyakarta: Graha Ilmu.


(2)

(3)

49

LAMPIRAN 1

Nilai GOF EPPS


(4)

LAMPIRAN 2

Hasil Analisis Reliabilitas Skor Komposit

A. Nilai Mean pada Koefisien Reliabilitas Sub Bagian EPPS

B. Nilai Mean pada Koefisien Reliabilitas Antar Sub Bagian EPPS

C. Perhitungan Analisis Reliabilitas Skor Komposit EPPS


(5)

51

A. Nilai Mean pada Koefisien Reliabilitas Sub Bagian EPPS No. Manisfestasi

Kebutuhan Koefisien Reliabilitas

1. Achievement 0.636

2. Deference 0.611

3. Order 0.767

4. Exhibition 0.619

5. Autonomy 0.605

6. Affiliation 0.657

7. Intraception 0.64

8. Succorance 0.745

9. Dominance 0.72

10. Abasement 0.658

11. Nurturance 0.649

12. Change 0.725

13. Endurance 0.727

14. Heterosexual 0.857

15. Aggression 0.712

Berdasarkan tabel yang disajikan di atas, nilai mean pada koefisien reliabilitas sub bagian EPPS adalah 0,69.

B. Nilai Mean pada Koefisien Reliabilitas Antar Sub Bagian EPPS

Ach Def Ord Exh Aut Aff Int Suc Dom Aba Nur Cha End Het Agg

Ach 1.000 .154 .164 .038 -.058 -.204 -.099 -.240 .024 -.189 -.301 -.096 .351 -.211 -.218 Def .154 1.000 .227 -.116 -.086 -.127 -.086 -.104 -.100 -.076 -.164 -.307 .011 -.034 -.163 Ord .164 .227 1.000 -.229 -.156 -.180 -.120 -.091 -.164 .062 -.125 -.232 .128 -.190 -.234 Exh .038 -.116 -.229 1.000 .082 -.178 -.052 -.105 .050 -.146 -.187 .092 -.090 -.107 .092 Aut -.058 -.086 -.156 .082 1.000 -.126 -.004 -.111 .043 -.207 -.259 .024 -.195 .073 .127 Aff -.204 -.127 -.180 -.178 -.126 1.000 .007 .028 -.114 -.085 .396 .048 -.125 -.105 -.229 Int -.099 -.086 -.120 -.052 -.004 .007 1.000 -.167 .003 .043 -.086 -.030 -.053 -.172 -.088 Suc -.240 -.104 -.091 -.105 -.111 .028 -.167 1.000 -.253 .082 .160 -.137 -.268 .027 .057 Dom .024 -.100 -.164 .050 .043 -.114 .003 -.253 1.000 -.260 -.190 -.061 .045 -.087 .089 Aba -.189 -.076 .062 -.146 -.207 -.085 .043 .082 -.260 1.000 .118 -.039 -.003 -.192 -.095 Nur -.301 -.164 -.125 -.187 -.259 .396 -.086 .160 -.190 .118 1.000 -.049 -.065 -.130 -.174 Cha -.096 -.307 -.232 .092 .024 .048 -.030 -.137 -.061 -.039 -.049 1.000 -.159 .039 -.026 End .351 .011 .128 -.090 -.195 -.125 -.053 -.268 .045 -.003 -.065 -.159 1.000 -.261 -.283 Het -.211 -.034 -.190 -.107 .073 -.105 -.172 .027 -.087 -.192 -.130 .039 -.261 1.000 .199 Agg -.218 -.163 -.234 .092 .127 -.229 -.088 .057 .089 -.095 -.174 -.026 -.283 .199 1.000


(6)

Berdasarkan tabel yang disajikan di atas, nilai mean pada koefisien reliabilitas antar sub bagian EPPS adalah 0,13.

C. Perhitungan Analisis Reliabilitas Skor Komposit EPPS

Berdasarkan nilai mean pada koefisien reliabilitas sub bagian dan antar sub bagian EPPS, maka hasil analisis reliabilitas skor komposit dari kelima belas (k =15) sub bagian EPPS adalah sebagai berikut.