1. Validitas
Azwar 2000 menyatakan bahwa validitas berasal dari kata validity yang mempunyai arti sejauhmana ketepatan dan kecermatan suatu alat ukur dalam
melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur dikatakan mempunyai validasi yang tinggi apabila alat tersebut menjalankan fungsi ukurnya
atau memberikan hasil ukur, yang sesuai dengan maksud dilakukannya pengukuran tersebut. Tes yang menghasilkan data yang tidak relevan dengan
tujuan pengukuran dikatakan sebagai tes yang memiliki validitas rendah. Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur
yang valid, tidak sekedar mampu mengungkapkan data dengan tepat tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut. Cermat berati
bahwa pengukuran itu mampu memberikan gambaran mengenai perbedaan yang sekecil-kecilnya diantara subjek yang satu dengan subjek yang lain. Untuk
mengkaji validitas alat ukur dalam penelitian ini, peneliti melihat alat ukur berdasarkan arah isi yang diukur disebut dengan validitas isi content validity.
Validitas isi memiliki dua tipe yaitu validitas muka dan validitas logik : a.
Validitas muka Validitas muka adalah tipe validitas yang paling rendah signifikansinya
karena hanya didasarkan pada penilaian terhadap format penampilan tes. Apabila penampilan tes telah meyakinkan dan memberikan kesan mampu
mengungkap apa yang hendak diukur maka dapat dikatakan bahwa validitas muka telah terpenuhi. Tes yang memiliki validitas muka yang
Universitas Sumatera Utara
tinggi akan memancing motivasi individu yang dites untuk menghadapi tes tersebut dengan sungguh-sungguh Azwar, 2000.
b. Validitas logik
Validitas logik disebut juga validitas sampling. Validitas tipe ini menunjuk pada sejauhmana isi tes merupakan representasi dari ciri-ciri atribut yang
hendak diukur. Untuk memperoleh validitas logik yang tinggi, suatu tes harus dirancang sedemikian rupa sehingga benar-benar berisi aitem yang
relevan dan perlu menjadi bagian tes secara keseluruhan. Suatu objek ukur yang yang hendak diungkap oleh tes haruslah dibatasi lebih dahulu
kawasan perilakunya secara seksama dan konkret. Batas-batas perilaku yang kurang jelas akan menyebabkan terikutnya aitem-aitem yang tidak
relevan dan tertinggalnya bagian penting dari tes yang bersangkutan Azwar,2000.
Penilaian validitas isi tergantung pada penilaian subjektif individual. Hal ini dikarenakan estimasi validitas isi tidak melibatkan perhitungan statistik apapun
melainkan dengan analisis rasional dan melalui professional judgement Azwar, 2004. Dalam penelitian ini, peneliti meminta professional judgement yaitu dosen
pembimbing peneliti. Setelah melakukan validitas isi kemudian dilanjutkan dengan melakukan
uji daya beda item. Uji daya daya beda aitem dilakukan untuk melihat sejauh mana aitem mampu membedakan antara individu atau kelompok individu yang
memiliki atribut dengan yang tidak memiliki atribut yang akan diukur. Prinsip kerja yang dijadikan dasar untuk melakukan seleksi item dalam hal ini adalah
Universitas Sumatera Utara
memilih item-item yang fungsi ukurnya selaras atau sesuai dengan fungsi ukur tes. Atau dengan kata lain, dasarnya adalah memilih item yang mengukur hal yang
sama dengan yang diukur oleh skala sebagai keseluruhan Azwar, 2000.
Pengujian daya diskriminasi item menghendaki dilakukannya komputasi koefisien korelasi antara distribusi skor item dengan suatu kriteria yang relevan
yaitu distribusi skor skala itu sendiri. Komputasi ini menghasilkan koefisien korelasi item total r
ix
yang dikenal pula dengan sebutan parameter daya beda item. Bagi skala-skala yang setiap aitemnya diberi skor pada level interval dapat
digunakan formula koefisien korelasi Pearson Product Moment. Semakin tinggi koefisien korelasi positif antara skor item dengan skor
skala berarti semakin tinggi konsistensi antara item tersebut dengan skala secara keseluruhan yang berarti semakin tinggi daya bedanya. Bila koefisien korelasinya
rendah mendekati nol berarti fungsi item tersebut tidak cocok dengan fungsi ukur skala dan daya bedanya tidak baik. Prosedur pengujian ini menggunakan taraf
signifikasi 5 p0,05. Menurut Ebel dalam Azwar, 2000 menyarankan kriteria evaluasi indeks diskriminasi item yaitu nilai 0,3 sudah dianggap bagus walaupun
masih mungkin untuk ditingkatkan. Penghitungan daya diskriminasi item dalam uji coba ini dilakukan dengan menggunakan program SPSS version 17.0 For
Windows.
2. Reliabilitas