PPT BAB 9_Interpretasi Skor

INTERPRETASI SKOR

  Oleh: Olivia Rumahpasal 832012016 Jenny M Salamor 832012017

  Susance Safessa 832012701  

Makna Skor (Sulistiyono, t.t)

  

Makna

Makna

Kemudian Kemudian

Pemberian Makna pada Skor (Sulistiyono, t.t)

  (a) (a) b)

  b)

  Pemberian Makna pada Skor (Sulistiyono, t.t) Hal

  Secara Secara

Perbedaan Skor & Nilai (Ipan, 2009)

  Skor Skor Hasil Hasil

  Nilai Nilai Angka Angka Metode Interpretasi Skor

(Sulistiyono, t.t)

e e r r i i a a

  Metode Interpretasi Skor u u

  D D (Sulistiyono, t.t) n n a ( a ( t t a l a l u u

  ) a ) a k k m m

  T T e e s s y y g g T T e e r r s s t t a a n n d d

Penilaian Acuan Patokan (PAP) (Ipan, 2009)

  • Pada acuan ini sebelum penilaian itu dilaksanakan harus ditetapkan lebih dulu patokan yg akan dipakai sebagai pembanding terhadap semua hasil pengukuran. Patokan di sini merupakan suatu patokan yg ditetapkan sebelumnya sebagai batas lulus (tingkat penguasaan minimum).
  • PAP didasarkan pada asumi bahwa:

  1. Hal- hal yg harus dipelajari oleh testee memiliki struktur hierarkis tertentu & bahwa masing-masing taraf harus dikuasai secara baik sebelum maju ke taraf selanjutnya.

  2. Evaluator atau tester dapat mengidentifkasi masing-masing taraf itu setidaknya mendekati tuntas.

  • Pemberian nilai kepada testee dilaksanakan dengan cara membandingkan antara skor mentah hasil tes yg dimiliki masing-masing testee dengan skor maksimum ideal (SMI) yg mungkin dapat dicapai oleh testee. Itulah sebabnya

  

Contoh Patokan yg Digunakan

dalam Dunia Pendidikan

(Ipan, 2009)

  Tingkat Nilai Akhir Bobot Interpretasi Penguasaan 80-100% A

  4 Memuaskan 70-80% B

  3 Baik 60-70% C

  2 Cukup 50-60% D

  1 Kurang Kurang dari E Gagal 50%

Penilaian Acuan Norma (PAN) (Ipan, 2009)

  Asumsi penggunaan PAN: 1.

  Tidak 2.

  Untuk

Acuan Norma (Sulistiyono, t.t)

  Hasil Hasil Biasanya Biasanya

  

Acuan Norma

“Macam-macam Konversi”

(Sulistiyono, t.t)

  

Skor

Skor

Skor

Skor

  

Acuan Norma “Macam-macam Konversi”

(Sulistiyono, t.t) Skor Skor Skor Skor

Acuan Acuan

  Biasanya Distribusi nilai-nilai itu telah Norma (

Langkah Pemberian Makna “Acuan Norma”

  Makna skor diperoleh dengan cara mendefnisikan skor tersebut ke dalam suatu skala tertentu.

  Untuk Selanjutnya

  

Transformasi Skor

(Sulistiyono, t.t)

Jenis Jenis

  Stanine Stanine Nilai Z & T dengan cara linear Nilai Z & T dengan cara linear

Kesamaan bentuk penyebaran dengan kurva normal

Kesamaan bentuk penyebaran dengan kurva normal

Stanel Stanel Kesamaan tingkat ( Kesamaan tingkat ( Skor berskala & Item Skor berskala & Item Rentang Rentang Skor Z & T dengan cara dikurva normalkan Skor Z & T dengan cara dikurva normalkan Deviation IQ Deviation IQ

Contoh Penerapan Transformasi Nilai Normal Persentil Norma-skor Standard

  Item Response Theory Tes

Normal Persentil (Setiawan, 2012)

  • Norma persentil berisi tabel persentase yg berkaitan dengan skor mentah tertentu. Skor mentah ini disebut sebagai persentil & persentase kelompok norma yg masuk ke bawah skor tertentu merupakan rentang persentil (persentil range) skor ini.
  • Peringkat persentil (persentil rank) cukup mudah dihitung & dipahami. Oleh karena itu lebih populer daripada norma standard.
  • Laporan psikologi yg berusaha keras untuk menekankan kejelasan akan berkata sesuatu, seperti: “John mendapat

  Norma-skor Standard (Setiawan, 2012)

  • • Tidak seperti peringkat persentil, skor standard

    menghadirkan pengukuran pada skala interval.
  • • Norma skor standard adalah skor terkonversi yg

    memiliki mean & standard deviasi yg diinginkan.

  • • Ada banyak skor standard yg berbeda, meliputi:

    skor z, skor Z, skor CEEB, skor IQ deviasi, skor stanine, skor T & skor NCE.

Skor Z (Setiawan, 2012)

  • Kenyataan bahwa skor z mungkin angka desimal negatif atau positif menciptakan beberapa kesulitan dalam menggerakkan angka itu.
  • Masalah dapat diselesaikan dengan mengalikan skor z dengan angka konstan & menambah angka konstan lain pada hasilnya.
  • Mengalikan z dengan 10, menambah 50 pada hasil & membulatkan hasil ke angka terdekat menghasilkan skor Z. Mean serangkaian skor Z adalah 50 & standard deviasi adalah 10 tetapi distribusi frekuensi skor Z memiliki bentuk yg sama dengan distribusi skor mentah asal.

Skor CEEB (Setiawan, 2012)

  • Skor CEEB (College Entrance Examination Board) ditentukan dengan mengalikan skor z yg berkaitan dengan 100 & menambah 500 ke hasilnya.
  • Misal: Dilakukan pada skor mentah pada Scolastic

  Aptitude Test (SAT) yg diselenggarakan pada 1941,

  menghasilkan distribusi baru yg memiliki mean 500 & deviasi standard 100.

  • Akan tetapi sesudah itu, skor yg diperoleh siswa dengan mengambil SAT tidak diubah dengan cara ini. Melainkan, untuk menyakinkan unit skor konstan dalam rangka membandingkan hasil tes dari tahun ke tahun

  Item Response Theory (Setiawan, 2012)

  Metode Metode Metode Metode

  • • Seperti digambarkan pada Gambar 4.2, bentuk kurva respons-item

    bervariasi mengikuti nilai parameter a & b. Kedua kurva pada

    gambar ini disusun dengan fungsi dua-parameter pada rumus 4.5.

  • • Pada kurva P, parameter kesulitan (b) adalah 1,00 & parameter

    diskriminan (a) adalah 0,5; pada kurva Q, b = 0,25 & a = 0,75.

  • • Catat bahwa b adalah nilai (titik pada sumbu horizontal) yg

    berhubungan dengan P( ) = 0,5 & a adalah kemiringan kurva ) – 0,5. Pada model 3 parameter, b adalah nilai P() yg pada P( berhubungan dengan 0,5 ( c + 1) dengan c adalah titik persilangan antara kurva respons-item dengan sumbu vertikal.
  • • Skor pada kontinum, kemampuan tersembunyi

    (latent ability continuum) dinyatakan sebagai unit skor standard (z ), tetapi pada penerapan sebagian besar pendidikan, skor z diubah ke skala yg memiliki mean 300 & deviasi standard 50.
  • • Pada praktek sesungguhnya, parameter item &

    skor kemampuan tersembunyi (latent ability score) peserta tes tidak diketahui.

  • Masalahnya adalah mencari kurva respons-item yg paling cocok dengan respons terhadap tiap-tiap item.
  • Pencarian ini melibatkan prosedur yg mungkin- maksimum secara interative dengan mengasumsikan nilai awal tertentu untuk parameter itemnya dengan ) yg berhubungan dengan berbagai menghitung P( nilai, membandingkan respons-item hasil prediksi dengan respons-item sesungguhnya & melanjutkan proses sampai solusi terbaik dapat diraih.
  • Proses estimasi parameter item membutuhkan respons banyak peserta tes yg mewakili populasi potensi peserta tes kira-kira 2.000 untuk model tiga parameter &1.500 untuk model satu parameter (Rasch).
  • Tidak seperti metodologi pengetesan tradisional, yg mengacaukan antara diskriminasi & kesulitan tes pada sampel tertentu orang yg dites, pada IRT maka parameternya adalah, setidaknya dalam teori, independen terhadap sampel tes.

  • Sifat IRT yg menarik lainnya, invariance kemampuan tes dengan respons terhadap item yang digunakan untuk mengestimasinya, berakar pada proses pengestimasian . Fitur IRT ini berarti bahwa tes pada level kesulitan manapun dapat dikelola untuk menentukan posisi seseorang pada berbagai level kemampuan tersembunyi (latent ability continuum).
  • IRT telah dipergunakan untuk berbagai tujuan, yg meliputi penyusunan tes, kalibrasi skor tes untuk menyediakan kerangka acuan guna menginterpretasikannya. Standardisasi tes, penentuan differential item functioning (DIF) & pengetesan adaptif.

Skor Standard yg Dinormalisir (Setiawan, 2012)

  • Skor z

  n dapat diubah menjadi skor dinormalisir yg memiliki mean & deviasi standard yg diinginkan.

  • • Skala skor lain adalah skala stanine yg diilustrasikan

    dengan skala ketiga dari bawah. Pada skala standard dinormalisir ini, yg memiliki mean 5 & deviasi standard

    sekitar 2, ada sembilan rentang berbeda atau stanine.

  • • Rentang ini didesain dari angka 1 – 9 & seperti

    diperlihatkan pada gambar, persentase tertentu dari distribusi skala normal berada dalam interval yg diwakili oleh stanine tertentu. Akan tetapi, skala stanine bukanlah skala standard sesungguhnya, karena stanine pertama & kesembilan terbuka di bagian akhir.
  • • Salah satu keunggulan skor stanine adalah bahwa skor

    tersebut mewakili rentang bukan titik tertentu. Keunggulan ini membantu melawan kecenderungan untuk memandang skor tes sebagai ukuran perbedaan individu yg sempurna & tidak bervariasi.

Tes Penyamaan (Equating Tests) (Setiawan, 2012)

  • Skor yg dibuat pada satu bentuk, sangat serupa dengan skor peserta tes yg sama pada bentuk pertama.
  • Proses penyamaan atau lebih tepatnya membuat perbandingan, dua tes dengan level kesulitan sama (misalnya kelas sama) disebut sebagai penyamaan horizontal (horizontal equating).
  • Penyamaan juga dapat dilakukan secara vertikal, seperti ketika skor pada dua tes yg memiliki level kesulitan berbeda (mis. Kelas berbeda) dipersamakan.
  • Secara umum, proses penyamaan melibatkan menjangkarkan tes ke tes umum atau kumpulan item, seperti pada Scholastic Aptitude Test

  Interpretasi Skor

Interprestasi Skor Interprestasi Skor (Azwar, 2012) (Azwar, 2012)

  

Pemberian makna atau interprestasi terhadap skor skala yg bersangkutan

Pemberian makna atau interprestasi terhadap skor skala yg bersangkutan

merupakan sisi diagnostika suatu proses pengukuran atribut psikologi. Tidak

merupakan sisi diagnostika suatu proses pengukuran atribut psikologi. Tidak

adanya makna mutlak pada X = 0 dari hasil pengukuran psikologi menjadi

adanya makna mutlak pada X = 0 dari hasil pengukuran psikologi menjadi

permasalahan bila diperlukan pemilahan skor individual ke dalam beberapa

permasalahan bila diperlukan pemilahan skor individual ke dalam beberapa

kelompok (kategori) diagnosis yg berbeda. kelompok (kategori) diagnosis yg berbeda.

  

Sekalipun skor pada skor psikologi yg ditentukan lewat prosedur penskalaan

Sekalipun skor pada skor psikologi yg ditentukan lewat prosedur penskalaan

akan menghasilkan angka-angka pada level pengukuran interval (Azwar,

akan menghasilkan angka-angka pada level pengukuran interval (Azwar,

1999), namun dalam interpertasinya hanya dapat dihasilkan kategori-kategori

1999), namun dalam interpertasinya hanya dapat dihasilkan kategori-kategori

atau kelompok-kelompok skor yg berada pada level ordinal. atau kelompok-kelompok skor yg berada pada level ordinal.

  Pada dasarnya, interpretasi terhadap skor skala psikologi bersifat Pada dasarnya, interpretasi terhadap skor skala psikologi bersifat

  normatif, artinya makna skor diacukan pada posisi relatif skor terhadap normatif, artinya makna skor diacukan pada posisi relatif skor terhadap

  suatu norma (mean) skor populasi teoretik sebagai parameter sehingga suatu norma (mean) skor populasi teoretik sebagai parameter sehingga hasil ukur yg berupa angka (kuantitatif) dapat diinterpretasikan secara hasil ukur yg berupa angka (kuantitatif) dapat diinterpretasikan secara kualitatif sehingga acuan tersebut dapat memermudah pengguna untuk kualitatif sehingga acuan tersebut dapat memermudah pengguna untuk memahami hasil pengukuran. memahami hasil pengukuran.

  Skor-mentah (raw score) yg memersentasikan hasil pengukuran suatu Skor-mentah (raw score) yg memersentasikan hasil pengukuran suatu skala merupakan penjumlahan dari skor aitem-aitem dalam skala skala merupakan penjumlahan dari skor aitem-aitem dalam skala tersebut sehingga skor dapat langsung dimaknai dengan mengacu pada tersebut sehingga skor dapat langsung dimaknai dengan mengacu pada norma interpretasi yg telah dibuat. norma interpretasi yg telah dibuat.

  Dalam kasus skor komposit yg setiap komponennya dapat berisi aitem Dalam kasus skor komposit yg setiap komponennya dapat berisi aitem dalam jumlah berbeda atau setiap komponennya diberi bobot yg tidak dalam jumlah berbeda atau setiap komponennya diberi bobot yg tidak sama, penjumlahan itu dilakukan dengan mengubah skor semua sama, penjumlahan itu dilakukan dengan mengubah skor semua komponen menjadi skor standar dengan mean & unit deviasi standar yg komponen menjadi skor standar dengan mean & unit deviasi standar yg

  

Kategorisasi Berdasar Model Distribusi

Normal

(Azwar, 2012)

  • • Kategori ini didasari oleh asumsi bahwa skor individu

    dalam kelompoknya merupakan estimasi terhadap skor individu dalam populasi & asumsi bahwa skor individu dalam populasinya terdistribusi secara normal.
  • • Dengan demikian kita dapat membuat batasan kategori

    skor teoretik yg terdistribusi menurut normal satndar.

  Lanjutan…

  • • Sebagaimana diketahui, suatu distribusi normal

    standar sebagai atas enam bagian atau enam

  satuan deviasi standar. Tiga bagian berada di sebelah kiri mean (bertanda negatif) & tiga bagian berbeda di sebelah kanan mean (bertanda positif) (Azwar, 2012).

Kategorisasi Jenjang (Ordinal) (Azwar, 2012)

  • Tujuannya untuk menempatkan individu ke dalam kelompok- kelompok yg posisinya berjenjang menurut suatu kontinum berdasar atribut yg diukur. Kontinum jenjang ini contohnya adalah dari rendah ke tinggi, dari paling jelek ke paling baik, dari sangat tidak puas ke sangat puas, dsb.
  • Banyaknya jenjang kategori diagnosis yg akan dibuat biasanya tidak lebih dari lima jenjang tetapi juga tidak kurang dari tiga. Mengelompokan individu-individu ke dalam hanya dua jenjang diagnosisi menjadi, misal: “semangat kerja rendah” & “semangat kerja tinggi”, selain kurang efsien juga akan menghadapi resiko
  • Andaikan suatu skala agresivitas terdiri atas 15 aitem maisng- masing aitemnya diberi skor yg berkisar mulai dari 0,1,2,3 sampai 4. Dengan demikian, skor terkecil yg mungkin diperoleh subjek pada skala tersebut adalah X = 0, yaitu (15x0) & skor terbesar adalah X = 60 (15x4). Maka rentang skor skala terbesar adalah 60 (60-0), kemudian dibagi dalam enam satuan deviasi standar sehingga diperoleh 60/6=10.

  • Angka 10 ini merupakan estimasi besarnya satuan deviasi standar populasi (σ) yg kita gunakan untuk membuat kategori normatif skor subjek. Karena kategorisasi ini bersifat relatif, maka luasya interval yg mencakup semua kategori yg diinginkan dapat ditetapkan secara subjektif selama penetapan itu berada

    dalam batas kewajaran & dapat diterima akal (common sense) .

  ~Lanjutan….Kategorisasi Jenjang (Ordinal) (Azwar, 2012)

  • Contoh kategorisasi yg dapat digunakan adalah:

  μ ≤ -1, 5σ Kategori Sangat Rendah

  • 1, 5σ < μ ≤ -0, 5σ Kategori Rendah -0, 5σ < μ ≤ + 0, 5σ Kategori Sedang +0, 5σ < μ ≤ +1, 5σ Kategoti Tinggi +1, 5σ < μ Kategori Sangat Tinggi Dalam populasi teoritik yg mengikiuti distribusi normal standar ( μ = 0; σ = 1), norma seperti di atas akan menghasilkan proporsionalitas distribusi skor sebagai berikut:
  • 3 -2 -1 0 +1 +2 +3 z
    • :----:----:----:----:----:---:----:----:----:----:----:----:----:----

  6,7% 32,3% 22% 32,3% 6,7%

  ~Lanjutan….Kategorisasi Jenjang (Ordinal) (Azwar, 2012)

  • Dari tabel distribusi normal dapat diketahui bahwa porporsi subjek yg skornya berada di sebelah kiri harga (z = -1,5) sama besar dengan proporsi yg berada di sebelah kanan harga (z = 1,5), yaitu 0,067 atau 6,7% proporsi subjek yg skornya berada di sebelah kiri harga (z = -0,5) adalah 0,39 atau 39%, sehingga yg terletak diantara (z = -0,5) & (z = -1,5) adalah sebanyak 39% - 6,7% = 32,2%.
  • Proposi subjek yg berada di sebelah kiri harga di antara (z = -0,5) adalah 0,11 atau 11% dengan demikian, proporsi subjek yg berada diantara (z – 0,5) & (z = 0,5) adalah 2x11%= 22%.
  • Distribusi proporsi di atas tampaknya sangat layak digunakan sebagai dasar kategorisasi subjek, sehingga bila diterapkan pada Skala Agresivitas (sebagai contoh)(secara teoritik kemungkinan skornya berkisar dari 0 sampai dengan 60 & σ = 10) akan menghasilkan kategori skor sebagai:

   X ≤ 15 Agresivitas sangat Rendah 15 < X ≤ 25 Agresivita Rendah

  ~Lanjutan….Kategorisasi Jenjang (Ordinal) (Azwar, 201 2)

  • Kategori ini kemudian dinyatakan sebagai acuan atau norma dalam pengelompokan skor individu yg dikenai skala agresivitas tersebut.
  • Tentu saja penyusun skala boleh membuat enam atau tujuh kategori jenjang sesuai dengan ketajaman tingkat diferensiasi yg dikehendakinya,
  • Akan tetapi semua itu ditetapkan lebih dahulu batasnya berdasarkan satuan deviasi standar tersebut di atas dengan memerhitungkan rentangan angka minimum-maksimum teoritiknya.

  Kategorisasi Bukan-Jenjang (Nominal) (Azwar, 2012)

Tujuan kategorisasi ini adalah menempatkan individu ke dalam

kelompok-kelompok diagnosis yg tidak memiliki makna ‘lebih’ &

‘kurang’ atau ‘tinggi’ & ‘rendah’.

  

Kasus semacam ini dijumpai contohnya ketika pengelompokkan

individu dilakukan berdasar skor Pola Asuh yg diterimanya (misal:

Demokratis, Bebas & Otoriter), atau ketika dilakukan kategorisasi

orientasi Coping (Orientasi Problem, Orientasi Emosi), atau

pengelompokan peran jenis (Kelompok Feminim, Maskulin,

Androgini & Tidak Tergolongkan).

  ~Lanjutan….Kategorisasi Bukan Jenjang (Ordinal) (Azwar, 2012 )

  • • Dapat dikatakan bahwa kalau skor Pola Asuh rendah maka

    berarti pola asuhnya tipe ‘bebas’ & jika skornya lebih tinggi menjadi tipe ‘demokratis’ & kalau skornya sangat tinggi menjadi pola asuh tipe ‘otoriter’. Jika diilustrasikan, letak kategorinya bukan seperti: _______________________________ Kontinum Pola Asuh Bebas Demokratis Otoriter

  

Bebas

Melainkan seperti:

  Demokrati Otoriter s Dalam kontrak teoretiknya, kategori seperti ini merupakan dimensi-dimensi yg terpisah. Dalam perancangan skala, masing-masing dimensi diungkap oleh aspek atau subskala yg berbeda isinya. Jelasnya, pada Skala Pola Asuh terdapat aitem-aitem yg ditulis berdasar indikator keperilakuan pola Demokratis, ada aitem-aitem yg ditulis indikator keperilakuan pola Otoriter, yg masing-masing memiliki skor tersendiri.

  Begitu pula pada contoh Skala Peran Jenis , terdapat di dalamnya aitem- aitem yg khusus mengungkap peran Androgini, aitem-aitem yg khusus mengungkap peran Feminim & juga aitem-aitem yg khusus mengungkap peran maskulin, yg jumlah aitem dalam masing-masing aspeknya belum tentu sama.

  ~Lanjutan….Kategorisasi Bukan Jenjang (Ordinal) Sebagai contoh disajikan suatu cara yg pernah dilakukan untuk kategorisasi skor Pusat Kendali (Locus of Control) guna keperluan penelitian (Partisari, dalam Azwar, 2012).

  Skala yg digunakan adalah skala IPC Levenson (Lao, 1977) yg dalam konsepnya mengatakan bahwa pusat kendali terbagi atas tiga arah orientasi kendali, yaitu:  Orientasi Internal (I) ; Orientasi Powerful Others (P); Oreintasi Chance (C) Dalam skalanya, ketiga orientasi pusat kendali tersebut diungkap oleh subskala

  (komponen) yg berbeda, yg masing-masing berisi delapan aitem Tujuan pengukuran skala ini adalah untuk memilahkan individu menurut arah pusat kendalinya, sebagai arah internal atau arah eksternal.

   Arah kendali Internal (I) tentu saja diungkap oleh subskala I.

   Arah Kendali Eksternal (E) diungkap secara bersama-sama oleh subskala P & subskala C . Jadi, komponen yg mengungkap arah kendali I berisi delapan aitem & komponen yg mengungkap arah kendali E berisi enambelas aitem.

  ~Lanjutan….Kategorisasi Bukan Jenjang (Ordinal)

  ~Lanjutan….Kategorisasi Bukan Jenjang (Ordinal) (Azwar, 2012)

  Masing-masing aitem dalam skala IPC tersebut diberi skor dalam enam jenjang, yaitu:

  • SS = 6
  • S = 5
  • AS = 4
  • ATS = 3
  • TS = 2
  • STS = 1

  Setiap subjek mendapat mendapat dua skor pusat kendali, yaitu pada arah orientasi eksternal (komponen I) & skor pada arah orientasi eksternal (komponen P dan C). Untuk menghitung skor individu pada masing-masing arah

  

~Lanjutan….Kategorisasi Bukan Jenjang (Ordinal)

(Azwar, 2012)

  • Internal:

  X =(∑X₁)/8 int

  • Eksternal:

  X = (∑Xp+ ∑XC)/16 eks Dari distribusi kedua skor ini dapat diperoleh rata-rata (mean) & deviasi standarnya masig-masing, yaitu M.., M.., S…., & S….. Kemudian skor mentah subjek dikoversikan atau diubah menjadi skor Z, yaitu:

  • Z =(Xi -M )/Si & int nt nt nt
  • Z = (X -M )/S eks eks eks eks Skor Z inilah yg digunakan sebagai dasar kategorisasi pusat kendali, dengan kriteria:
  • Z ≥0,05 & Z < 0 Kendali Internal int eks
  • Z ≥0,05 & Z < 0 Kendali Eksternal eks int Sedangkan semua individu yg skor Z nya tidak memenuhi kriteria tersebut diangap

  ~Lanjutan….Kategorisasi Bukan Jenjang (Ordinal) (Azwar, 2012)

  Cara kategorisasi bukan-jenjang dapat diterapkan pula untuk membedakan individu kedalam tiga atau empat kelompok diagnosis. Dengan menghitung nilai Z untuk skor pada masing-masing komponen atau subskala yg dirancang untuk mengukur dimensi yg berbeda, maka akan dapat dibuat suatu kriteria yg layak. Contoh: Skala Peran Jenis yg terdiri atas dua komponen yg masing-masing mengungkap indikasi peran jenis Maskulin (M) & indikasi peran jenis Feminim (F). Setelah skor pada masing-masing komponen diubah menjadi skor Z dapat dibuat kriteria untuk kategorisasi peran jenis ke dalam empat kelompok diagnosis, misal sebagai berikut: Z ≥ 0,75 & z < 0 Maskulin •

  

Kategorisasi Berdasar Signifkansi Perbedaan

(Azwar, 2012)

  • Cara kategorisasi yg kedua adalah dengan menguji signifkansi perbedaan antara mean skor empirik atau mean sampel (M) & mean skor teoritik atau mean populasi (µ).
  • Cara ini bertujuan untuk kategorisasi individu ke dalam jenjang-jenjang

  Rendah, Sedang & Tinggi namun tidak dengan mengasumsikan distribusi populasi yg normal. Aplikasinya terutama apabila jumlah individu dalam kelompok yg hendak didiagnosis tidak begitu besar.

  • Dengan cara ini, tidak ditentukan lebih dahulu kriteria kategorisasinya melainkan akan ditetapkan suatu interval skor yg mencakup kategori tengah atau kategori sedang. Untuk itu perlu dihitung batas-bawah & batas-atas suatu interval skor-skor yg berbeda secara signifkan dari harga mean populasi, menurut tingkat kepercayaan yg diinginkan.

  Lanjutan… (Azwar, 2012)

  • Hal ini dilakukan dengan rumusan interval:

  µ-t (S/√n)≤ X ≤ µ + t (S/√n) (α/2,n-1) (α/2,n-1) µ : Mean teoritis pada skala t Harga t pada α/2 dan derajat kebebasan n-1

  (α/2,n-1) : S : Deviasi standar eror n : Banyaknya subjek

  • • Interval tersebut merupakan interval skor yg digolongkan

    sebagai kategori tengah atau sedang pada taraf signidikansi sebesar α atau taraf kepercayaan sebesar (1- α). Skor yg lebih besar daripada batas-batas interval akan diinterpretasikan sebagai tinggi sedangkan skor yg lebih kecil daripada batas-bawah interval termaksud dikategorikan sebagai rendah.

  Lanjutan… (Azwar, 2012)

  • • Mengambil contoh terdahulu, distribusi skor Skala Harga Diri

    memiliki mean teoritik sebesar µ = 120. Setelah dikenakan pada sekelompok subjek diperoleh, misal: mean kelompok sebesar M=95 & deviasi standar sebesar s=24, sedangkan banyaknya subjek adalah 100.
  • • Untuk membentuk sebuah interval skor tengah dengan taraf

    kepercayaan 95% (0,95) atau taraf signifkansi α= 0,05 dicari lebih dahulu harga t untuk α/2 & derajat kebebasan n- 1, yaitu t (α/2,n-1) yg dalam kasus ini dinyatakan sebagai t Dari Tabel Nilai-nilai Kritis diketahui bahwa (0.025;99).

  t = 1,98.

  (0.025;99)

Lanjutan.. (Azwar, 2012)

  • Menggunakan rumusan interval di atas, diperoleh: 120 – (1,98) (24/√100) ≤ X ≤ 120 + (1,98) (24/ √100) 115,25 ≤ X ≤ 124,75 115 ≤ X ≤ 125
  • • Dengan demikian, diperoleh norma kategorisasi

    diagnosis berdasar skor sebagai berikut: 115 125 ………….:…………..:…………. X (Rendah) (Sedang) (Tinggi) atau dibuat seperti: X ≤ 115 Harga diri rendah 115 X ≤125 Harga diri sedang

Lanjutan… (Azwar, 2012)

  • • Semua subjek yg skornya berada di bawah

    interval tersebut (X kurang dari 115) didiagnosis sebagai memiliki tingkat harga diri rendah & semua subjek atau kelompok subjek yg skornya berada di atas interval tersebut (X lebih daripada 125) didiagnosis sebagai memiliki tingkat harga diri yg tinggi.
  • • Untuk kemudahan, program SPSS juga dapat

    dimanfaatkan untuk membantu komputasi

  Lanjutan.. (Azwar, 2012)

Ikuti langkah berikut ini:

  

a) Buka SPSS & pada halaman Data Editor (spread sheet) masukkan

data skor skala (X) seluruh subjek. Sebagai contoh digunakan data dari tabel 5.1 dengan hanya mengambil data skor skala (X).

  Subjek

  X

  1.A

  11

  2. B

  39

  3. C

  40

  4. D

  13

  5. E

  19

  6. F

  39

  7. G

  45

  8. H

  11

  9. I

  39

  10. J

  19

  11. K

  16 Lanjutan… (Azwar, 2012) b) Klik menu Analyze, pilih Compare Means & klik One Sample T-Test.

  

d) Klik tombol Options. Pada kotak One Sample T-Test: Options,

nampak pilihan taraf kepercayaan (confdence interval) yg telah berisi angka 95, yaitu untuk taraf signifkansi α = 0,05. Angka ini dapat dibuah sesuai keinginan kita mengenai berapa tingkat kepercayaan yg diinginkan. Setelah itu klik tombol Continue.

  

e) Setelah kembali ke kotak dialog One-Sample T-Test, klik tombol OK

& sekejap sudah ada output One Sample Statistics. Pada kotak paling kanan tabel tampak harga Std. Error Mean sebesar 4,132, yaitu (s/√n).

  • Harga t dengan α=0,05 & n-1 dalam contoh ini adalah t =

  (α/2,n-1) (0,025:10)

  2,228. (Angka 2,228 diperoleh dari Tabel-t yg dapat dijumpai di dalam buku-buku Statistika untuk sampel berukuran maksimal n=100. Bila ukuran sampel melebihi 100, harga t akan sama dengan harga z & dapat dilihat pada tabel deviasi normal).

  • • Jadi, untuk contoh data skor di atas diperoleh interval nilai tengah

    untuk kategori sedang sebagai berikut: µ - 2,228 (4,132) ≤ X ≤ µ + 2,228 (4,132) dengan µ=24, maka kategori sedang adalah: 24 – 9,206 ≤ X ≤ 24 + 9,206 15 ≤ X ≤ 33

  Lanjutan…(Azwar, 2012)

  15 33

  • ……….. : ………… : ………… x (Rendah) (Sedang) (Tinggi) atau X ≤ 15 Kategori rendah

  15 X ≤33 Kategori sedang 33 <X Kategori tinggi Lanjutan… (Azwar, 2012)

  

Pertimbangan Eror Standar dalam Pengukuran

  • Eror standar dalam pengukuran adalah deviasi standar eror yg menunjukkan besarnya variasi eror pengukuran pada sekelompok subjek. Besarnya variasi eror ini erat berkaitan dengan koefsien reliabilitas skala & varians skor kelompok. Semakin besar eror standar dalam pengukuran berarti hasil pengukuran semakin tidak dapat dipercaya. Sebaliknya, semakin kecil angka eror standar berarti hasil pengukuran semakin cermat. Rumusan eror standar dalam pengukuran disajikan kembali sebagai: s e = s X √ (1-r
  • XX’ )<
  • Sebagai contoh, suatu Skala Agresivitas memiliki koefsien reliabilitas r =
  • XX 0,800 yg dihitung dari skor kelompok yg memiliki varians s X2 = 20. Eror standar dalam pengukuran ini adalah:

    • s X = √20 = 4,472 s = 4,472 √ (1-0,800) = 1,999 e

      Besarnya s e ini akan memerlihatkan kisaran estimasi skor sebenarnya pada taraf kepercayaan tertentu. Dengan kata lain, mengetahui besarnya s akan e memberikan gambaran kecermatan fungsi ukur skala karena dengan menggunakan s fuktuasi skor Agresivitas tersebut dapat diestimasi, yaitu: e X ± z α/2 (s e ) Bila digunakan taraf kepercayaan sebesar 90% yg berarti sama dengan taraf signifkansi sebesar 10% atau α= 0,10 maka α/2 = 0,05. Nilai z 0,05 dicari pada tabel deviasi normal dengan melihat nilai z untuk p=0,05; yaitu z= 1,65. Nilai ini dapat juga ditemukan dengan melihat z yg –karena 0,95 distribusi normal bersifat simetrikal- besarnya sama, yaitu 1,65 dengan tanda positif.

      Lanjutan… (Azwar, 2012)

    • Dengan begitu fuktuasi skor Agresivitas menurut hasil ukur skala tersebut adalah: X ± 1,65 (1,999) X ± 3,298 atau dibulatkan menjadi X ±3
    • • Dengan fuktuasi atau kisaran enam angka (tiga angka lebih besar &amp; tiga angka lebih

      kecil) tersebut, maka perbedaan skor Agresivitas sebesar empat angka antara dua orang responden, misalnya X=21 &amp; X=25, sangat mungkin terjadi karena eror pengukuran semata-mata, bukan karena adanya perbedaan yg sebenarnya.
    • • Dalam kegiatan penelitian, terkadang peneliti hanya membagi skor subjek ke dalam

      dua kategori diagnosis saja, yaitu agresivitas tinggi &amp; agresivitas rendah. Kategorisasi ini jelas terlalu sedehana (oversimplifed) &amp; seringkali dilakukan dengan cara yg tidak tepat, yaitu menggunakan harga rata-rata atau mean sebagai nilai batas kategori. Skor yg lebih besar daripada mean didiagnosis sebagai tinggi sedangkan skor yg berada di bawah mean didiagnosis rendah. Hal ini dapat membawa masalah.

      Lanjutan…(Azwar, 2012)

    • • Andaikan distribusi skor agresivitas yg dicontohkan ini memiliki

      mean=30. Menurut kriteria di atas, skor X= 29 harus didiagnosis sebagai agresivitas rendah sedangkan skor X=31 harus didiagnosis sebagai agresivitas tinggi. Pada sisi lain, skor X=4 pun harus didiagnosis sama-sama rendah dengan skor X=29 &amp; skor X=54 harus didiagnosis sama-sama tinggi dengan skor X=31. Jadi selisih sebesar 2 angka (31-29) disekitar mean harus dibedakan, sedangkan selisih 25 angka (29-4) &amp; selisih 23 angka (54-31) tidak dibedakan kategorinya. Kenyataan seperti itu agak sulit untuk diterima.

      29 30 31 (Rendah) (M) (Tinggi) ----------.-----------.-----------.---------- x

    • • Menurut fuktuasi skor agresivitas yg besarnya enam angka,

      sangat mungkin seseorang yg mendapat skor X= 29 (kisaran peluang antara 26 sampai dengan 32) &amp; orang lain yg mendapat skor X= 31 (kisaran peluang antara 28 sampai dengan 34) sebenarnya memiliki skor yg sama. Lihat ilustrasi di bawah ini:
      • :-----:----:-----:----:-----:-----:------:-----:-----:-----:-----:
      • 25 26 27 28 29 30 31 32 33 34 35

      36 X

    • Tampak terjadi tumpang tindih antara kisaran skor 29 &amp; kisaran

    • • Dalam kasus seperti ini, seyogyanya pemisahan kategori

      rendah &amp; tinggi dapat dilakukan dengan menggunakan batas kisaran skor atau fuktuasi skor mean seperti ilustrasi di bawah ini: Rendah Tinggi
      • :-----:----:-----:----:-----:-----:------:-----:-----:-----

      25 26 27 28 29 30 31 32 33 34 35 X

    • • Dengan mean skor M=30 maka batas skor untuk kategori

      Tinggi dimulai dari skor 30+3=33 sedangkan batas skor untuk kategori Rendah dimulai pada skor 30-3+ 27. Jadi, individu yg memeroleh skor X= 34 pada skala dapat didiagnosis sebagai agresivitas tinggi sedangkan individu yg memeroleh skor X=25 dapat didiagnosis sebagai memiliki agresivitas rendah. Individu yg skornya berada di antara X=27 &amp; X=33 tidak perlu diklasifkaiskan karena tujuan semula memang hanya untuk memisahkan subjek ke dalam dua kategori saja.

    • • Azwar, S. (2012). Penyusunan skala psikologi. Edisi 2. Yogyakarta: Pustaka

      Pelajar.
    • • Ipan, G. (2009). Interpretasi hasil pengukuran dalam evaluasi pendidikan.

      Diakses pada tanggal

       .

    • • Setiawan, A. (2012). Analisis item dan standarisasi tes. Diakses pada tanggal 31

      Maret 2013 dari http://adisetiawan26.fles.wordpress.com/2012/02/analisis-item- dan-standardisasi-tes.pp--- ppt.
    • • Sulistiyono, S. (t.t). Interpretasi skor. Diakses pada tanggal 31 Maret 2013 dari