3 cukup dominan dalam TOAFL. Perbedaan lainnya adalah jika skor tertinggi TOEFL
berkisar 680, maka skor tertinggi TOAFL adalah 700. Jika TOEFL tidak menguji penguasaan gramatika secara spesifik, TOAFL menguji kemampuan nahwu dan sharaf,
jabatan kata, i’râb infleksi, bentuk kata dan makna beberapa makna adawât partikel
yang digunakan dalam teks. Keberlangsungan dan keandalan TOAFL sebagai instrumen tes bahasa Arab yang
valid dan reliabel di masa-masa mendatang, tentu saja, sangat menjadi harapan banyak pihak, baik UIN Jakarta, perguruan tinggi lainnya maupun Departemen Agama dan
Diknas RI. Bahkan mantan Menteri Pendidikan Nasional, A. Malik Fadjar sangat mendukung adanya TOAFL di UIN, ketika bertemu mantan Rektor UIN Azyumardi
Azra, Purek Bidang Pengembangan Lembaga Suwito dan kami di kantor Mendiknas pada Juli 2003 lalu. Karena itu, uji validitas dan reliabilitas menjadi keharusan yang
sangat mendesak, karena sejauh ini TOAFL belum pernah diuji dan dinilai validitas dan reliabilitasnya secara akademik. Pengujian validitas dan reliabilitas tidak hanya dapat
menghasilkan tes yang lebih terpercaya, melainkan juga dapat menambah bobot kredibilitas dan akuntanbilitasnya, baik pada level substansi kebahasaannya maupun
institusionalnya. Pengujian validitas dan reliabilitas TOAFL juga dapat memantapkan langkah UIN ke depan dalam pengembangan pembelajaran bahasa Arab, baik untuk
tingkat S1, maupun S2 dan S3.
B. Batasan dan Rumusan Masalah
Obyek penelitian ini adalah lembar jawaban TOAFL yang dikerjakan oleh para peserta tes, baik program S1, S2 maupun S3, sepanjang tahun 2003. Hal ini didasarkan
atas pertimbangan bahwa jawaban yang diberikan bersifat netral, bebas dari unsur ―rekayasa‖ dan betul-betul mencerminkan kemampuan bahasa Arab mereka, karena
mereka sebelumnya tidak diberi tahu bahwa hasil tes mereka akan dijadikan sebagai bahan pengujian validitas dan reliabilitas. Lembar jawaban ini diperoleh dan didata dari
peserta yang pernah mengikuti TOAFL pada Pusat Bahasa PB UIN Jakarta dalam tahun tersebut.
Lembar jawaban yang diteliti dibatasi pada TOAFL form edisi 3, 4, dan 5, karena ketiga form itu paling sering digunakan. Ketiga form pertama relatif disusun
4 berdasarkan pen
galaman sebelumnya sehingga tingkat ―kematangannya‖ relatif lebih tinggi daripada kedua form terakhir.
Berdasarkan pembatasan tersebut, penelitian ini akan menjawab permasalahan berikut: ―Bagaimana tingkat validitas dan reliabilitas lembar jawaban TOAFL form 3, 4,
dan 5 yang diujikan oleh Pusat Bahasa UIN Syarif Hidayatullah Jakarta dalam tahun 2003 dan diikuti oleh peserta tes dari program S2 dan S3 UIN Jakarta dapat
dipertanggung-jawabkan secara akademik ?‖
C. Tujuan dan Signifikansi Penelitian
Tujuan penelitian ini adalah untuk membuktikan: 1 tingkat validitas dan reabilitas butir-butir soal TOAFL form 3, 4, dan 5; dan 2 tingkat kesulitan dan daya
beda tes TOAFL yang digunakan oleh Pusat Bahasa Universitas Islam Negeri UIN Syarif Hidayatullah Jakarta dan diikuti oleh peserta tes dalam tahun 2003 dan awal
2004. Hasil penelitian ini diharapkan sangat signifikan atau berguna bagi:
1. Departemen Agama RI, hasil penelitian ini dapat dijadikan sebagai masukan bagi pengambilan kebijkan mengenai kemungkinan perlunya pemberlakuan TOAFL di
lingkungan Pendidikan Tinggi Agama Islam, baik negeri maupun swasta. 2. UIN Syarif Hidayatullah Jakarta, untuk memberikan kepastian akademis berupa
standarisasi tes yang bertaraf internasional, sehingga jika tingkat kelayakan, validitas dan reliabilitas TOAFL teruji secara signifikan dapat dipatenkan sebagai salah satu
karya intelektual yang patut dikembangkan; 3. Pusat Bahasa, hasil penelitian ini sangat signifikan sebagai alat evaluasi untuk
perbaikan dan peningkatan mutu TOAFL yang akan diterbitkan, sehingga tingkat validitas dan reliabilitas dapat lebih dipertanggungjawabkan secara akademik.
4. Penyusun TOAFL, terutama dalam perbaikan butir-butir soal yang dinilai tidak valid dan reliabel, dan pengayaan materi dan variasi substansi berikut model pertanyaan
yang dimunculkan dalam TOAFL-TOAFL mendatang.
D. Kerangka Teori 1. Tes sebagai Instrumen Evaluasi