WAKTU PELAKSANAAN EVALUASI

B. WAKTU PELAKSANAAN EVALUASI

Evaluasi bisa terjadi pada waktu yang berbeda-beda selama perencanaan dan pelaksanaan satu program. Kapan terjadinya evaluasi terkait erat dengan peran apa yang

3 E.F. Kelly menyajikan beberapa analisis paling jelas mengenai argumen evaluatif dan hubungannya dengan praktik pada sejumlah makalah terbaru yang

dirujuk dalam catatan kaki di muka.

Bagian Pertama: Konsep-konsep Elementer

dimainkan evaluasi dan jenis-jenis keputusan yang menjadi tujuan dari kontribusinya.

1. Dilaksanakan di awal-mula proyek, selama atau sepanjang tahapan desainnya, evaluasi menyediakan mekanisme untuk mengidentifikasi berbagai isu, kendala, dan pokok-pokok penting potensi intervensi program. Peranan ini sering dipaparkan sebagai “analisis kebutuhan”, tempat evaluasi beroperasi sebagai analisis kebijakan.

2. Dilaksanakan selama berlangsungnya proyek, evaluasi menyediakan cara untuk membangun proses self- correcting ke dalam program. Dalam peranan ini, evaluasi menyediakan informasi untuk penyesuaian-ulang yang diperlukan pada saat operasi dan pelaksanaan suatu program. Evaluasi juga memberikan peringatan sehubungan dengan kebijakan, prosedur, dan elemen- elemen program yang mungkin memiliki konsekuensi negatif yang tak terlihat sebelum berbagai konsekuensi seperti itu mencapai proporsi yang bersifat merusak. Evaluasi seperti ini biasanya disebut “Evaluasi formatif.”

3. Dilaksanakan pada akhir proyek, evaluasi menghasilkan informasi untuk membantu keputusan jangka-panjang - mengenai apakah suatu program sebaiknya diperluas atau diakhiri, dilestarikan atau direvisi, disebarkan ke lokasi lain atau ditinggalkan sama sekali. Proses ini disebut “evaluasi sumatif.”

Berbagai program internasional yang dibiayai oleh para donor biasanya mengamanatkan evaluasi formal dengan peran sumatif agar menyampaikan pertimbangan mengenai keberhasilan atau kegagalan proyek pada bagian kesimpulan. Meskipun demikian, sampai saat ini evaluasi pada program bantuan teknis internasional telah membuktikan bahwa evaluasi paling banyak memberikan keuntungan atau manfaat kalau dilaksanakan sejak awal, dengan perannya sebagai analisis kebijakan dan analisis kebutuhan. Evaluasi yang dilaksanakan setelah satu program selesai (meskipun secara

Evaluasi Program: Teks Pilihan untuk Pemula

potensial masih cukup bermanfaat), agak terlambat untuk dapat membantu proyeknya. Kegunaan hasil evaluasi sumatif pada upaya desain proyek berikutnya dibatasi oleh: (a) langkanya replikasi program bantuan teknis skala besar dan (b) bila replikasi itu benar-benar dilaksanakan, maka kebutuhan akan komitmen pada desain-ulang atau kontinyuasi jauh sebelum tersedianya data sumatif mengenai siklus proyek terdahulu. Hal ini menimbulkan paradoks dalam perencanaan program. Mandat paling jelas untuk evaluasi (peran sumatif) akan mendorong dilaksanakannya evaluasi setelah poin kegunaan maksimum (peran normatif).

Kerangka yang berguna untuk mempertimbangkan peranan yang dapat dimainkan evaluasi dalam perencanaan dan operasi program dipersembahkan oleh Stufflebeam

(1971). 4 Ia membuat pembedaan di antara berbagai konteks, input, proses, dan produk evaluasi menurut saat terjadinya kegiatan evaluasi program dan menurut tipe pertanyaan evaluasi apa yang ingin mereka ajukan.

Evaluasi konteks dilaksanakan untuk mengidentifikasi kondisi, berbagai isu, kesempatan, dan kendala yang ada di dalam lingkungan program. Hal ini semacam analisis kebutuhan, suatu kegiatan awal untuk mengidentifikasi berbagai jenis program yang sesuai atau cocok dengan latar belakang yang tersedia.

Evaluasi konteks pada awalnya melibatkan upaya identifikasi berbagai keterbatasan ranah yang akan dilayani. Data dikumpulkan untuk mengidentifikasi kondisi yang ada, kebutuhan yang tak terpenuhi, dan berbagai kesempatan yang tak digunakan, juga untuk mengidentifikasi berbagai permasalahan yang bisa membatasi respon atas kebutuhan dan kesempatan. Bilamana mungkin, analisisnya itu ditarik dari sumber data yang ada; meskipun demikian, berbagai kajian empiris tambahan mungkin juga diperlukan untuk mengumpulkan informasi.

4 Stufflebeam, D.L. et. al. (1971). Educational evaluation and decision making. Itacha: Peacock.

Bagian Pertama: Konsep-konsep Elementer

Informasi yang disediakan oleh evaluasi konteks, memberi kontribusi beberapa tipe keputusan: (a) setting yang akan ditetapkan, (b) tujuan umum yang akan diupayakan, dan (c) sasaran yang akan dicapai. Analisis konteks berfungsi sebagai latar belakang kegiatan desain proyek yang lebih terinci dan spesifik yang mungkin menyertainya.

Analisis konteks pada berbagai program internasional diillustrasikan oleh analisis sektor sebagaimana yang dilakukan oleh Bank Dunia atau USAID. 5 Tujuan dari kajian ini adalah untuk memeriksa dan menaksir sumberdaya, rencana, kebutuhan, persoalan dan kesempatan yang ada pada sektor ekonomi perorangan. Namun, mengapa suatu pemerintahan merasa perlu untuk menjalankan analisis seperti itu? Salah satu alasannya adalah bahwa kegiatan kementerian berhubungan dengan resolusi persoalan atau implementasi kebijakan tertentu. Kementerian melaksanakan berbagai kajian tentang persoalan mendesak namun jarang memiliki kesempatan untuk membentuk satu tinjauan menyeluruh.

Contoh evaluasi konteks dalam lingkungan internasional adalah pengembangan the USAID Project Identification Document (PID) yang memberikan data assessment kebutuhan, analisis kebijakan, dan rasional berbasis-luas untuk proyek dalam bidang program yang ada. Evaluasi ini berfokus pada satu proyek tertentu daripada ke seluruh sektor, namun evaluasi ini masih mendahului desain proyek spesifik. Jelas, berbagai kegiatan identifikasi proyek akan sangat pesat kemajuannya jika didahului oleh assessment sektor.

5 Prosedur analisis sektor Bank Dunia dipaparkan di dalam karya Baum, W.C. & S.M. Tolbert. (1985). Investing in development: lessons of World Bank experience.

Washington, D.C.: The World Bank. Teknik assessment sektor yang digunakan pada sejumlah kajian yang disponsori oleh USAID dipaparkan dalam karya Cieutat, V.S. (1983). Planning and managing an education sector assessment. Washington, D.C.: United States Agency for International Development. dan Cieutat, V.S. (1986). Planning and managing an education section assessment : Lihat juga, Robinson, B. (1973). On methodology for education sector analysis. Washington, D.C.: United States Agency for International Development.

Evaluasi Program: Teks Pilihan untuk Pemula

Evaluasi input memberikan informasi untuk menentukan bagaimana cara memanfaatkan sumberdaya agar dapat

mencapai tujuan dan sasaran proyek. Evaluasi ini terdiri dari upaya identifikasi dan analisis: (a) kapabilitas agen dan kelompok yang bertanggung-jawab yang relevan, (b) berbagai strategi untuk mencapai tujuan proyek, dan (c) desain untuk mencapai strategi spesifik. Informasi yang diberikan dalam suatu evaluasi input merupakan informasi yang penting untuk menstrukturkan desain spesifik agar dapat mencapai tujuan proyek.

Taraf operasi evaluasi input sebagai satu aktivitas formal bervariasi berdasarkan sponsor dan proyek, meskipun semua proyek pemerintah dan agen pemberi donor mengadakan semacam perencanaan serta memperhitungkan berbagai isu yang dikemukakan di dalam evaluasi input. Contoh evaluasi input di USAID ditunjukkan melalui tahapan Project Paper pengembangan proyek. Selama tahapan itu, konsep proyeknya (yang diidentifikasi di dalam PID-nya) diuraikan secara panjang lebar dan diusulkan desain spesifik proyek. Kegiatan ini mencakup penaksiran antisipasi kapabilitas kelompok yang relevan, kesesuaian berbagai strategi alternatif, dan kelayakan proposal desainnya. Semua inputs dievaluasi berdasarkan kriteria biaya terendah, biaya manfaat, atau efektivitas biaya.

Evaluasi proses sinonim dengan apa yang secara luas disebut evaluasi formatif. Tiga tujuan utamanya adalah: (1) agar dapat mengidentifikasi berbagai konsekuensi program tak-terantisipasi tepat pada waktunya untuk kepentingan para manajer program dengan maksud agar dapat menghindari segala konsekuensi yang tidak diinginkan; (2) agar dapat memberikan informasi yang berkesinambungan mengenai kinerja program (misal, tingkat implementasi, konsistensi pada tujuan awal, persoalan sehubungan dengan cara program itu akan ditangkap atau diterima); dan (3) agar dapat mendo- kumentasikan segala apa yang terjadi dengan proyeknya.

Bagian Pertama: Konsep-konsep Elementer

Pentingnya fungsi terakhir ini ternyata lebih besar daripada yang selama ini diduga. Program dan proyek sering ditanggapi dengan dokumentasi yang kurang cermat mengenai kegiatan implementasi. Terlampau sering program disimpulkan sebagai program yang berhasil (atau tidak) tanpa memaparkan berbagai relevansi dimensi dari apa yang sedang terjadi sedemikian sehingga upaya yang lebih kemudian untuk mereplikasi (atau menghindari) komponen-komponen yang berhasil (atau tidak berhasil) dihalangi oleh ambiguitas sehubungan dengan apa yang sebenarnya terjadi. Layanan evaluasi pada program bisa dikatakan buruk, padahal evaluasilah yang memberikan kesimpulan tentang efektivitas dan dampak dari program. Hal ini disebabkan evaluasi itu gagal mendokumentasikan berbagai kegiatan dan peristiwa yang sebenarnya membentuk program tersebut.

Audiensi utama evaluasi proses, atau formatif, adalah mereka yang berwenang untuk melakukan penyesuaian seperlunya di tengah proses pelaksanaan evaluasi tersebut. Audiensi ini biasanya terdiri dari manajer program atau (pada beberapa kasus) sponsor program. Evaluasi proses cenderung disajikan dengan cara yang kurang formal daripada evaluasi konteks, input, atau produk. Dalam hal ini, tekanannya ada pada informasi tepat waktu yang berkesinambungan sehubungan dengan apa yang sedang berlangsung. Akibatnya, format laporan lebih cenderung ke bentuk yang bisa mencakup memorandum dan percakapan tak-resmi daripada dalam bentuk laporan tertulis resmi.

Anehnya, manakala program bantuan teknis internasional cenderung memiliki konteks kuat dan evaluasi masukan, maka program itu cenderung lemah dalam evaluasi proses. Ada beberapa faktor yang ikut mempengaruhi kecenderungan ini. Pertama , tidak selalu mudah mengubah komitmen dan kontrak awal agar dapat memecahkan persoalan yang sedang berjalan. Perubahan seperti itu memerlukan banyak justifikasi dan kerja ekstra, dan juga menimbulkan pertanyaan pada tingkat administrasi yang lebih tinggi sehubungan dengan keandalan

Evaluasi Program: Teks Pilihan untuk Pemula

proses perencanaan awalnya. Apalagi, pada program yang terdesain-baik, semua komponen saling berhubungan. Perubahan satu faktor akan mendorong rangkaian perubahan pada faktor lain yang memiliki dampak lebih luas. Hasil evaluasi formatif kadangkala diabaikan (atau tak pernah diupayakan) karena adanya keyakinan tak-terucapkan oleh para manajer program bahwa dalam melaksanakan perubahan (yang bisa mencerminkan rencana awalnya dengan cara yang kurang baik atau efektivitas biayanya nampak meragukan dengan adanya kemapanan prosedur dan biaya tetap) kepatuhan pada rencana awal (bahkan jika rencana itu cacat) lebih disukai.

Kedua , proyek internasional skala-besar beroperasi di dalam konteks dengan ikatan berbagai kelompok kepentingan yang kuat dan aktif. Satu perubahan dalam operasi program dapat merugikan beberapa kelompok bahkan jika perubahan itu sangat menguntungkan atau menarik bagi kelompok- kelompok lain. Kurangnya kejelasan atensi di pihak staf proyek atau personalia kementerian pada evaluasi formatif kadangkala disebabkan oleh keengganannya untuk melakukan tindakan yang dapat merugikan atau mengancam kelompok kepentingan yang paling menonjol.

Ketiga , prosedur desain proyek acapkali memerlukan tim khusus untuk melaksanakan evaluasi konteks, masukan, dan produk, namun biasanya mereka tidak memberikan evaluasi proses secara spesifik. Evaluasi proses cenderung sekadar dilimpahkan pada tim manajemen proyek. Praktiknya, biasanya diasumsikan bahwa pemantauan kegiatan sponsor dan kewajiban adminisatratif reguler dari staf program akan dapat mendeteksi berbagai perubahan yang diperlukan. Sayang sekali kejadiannya tidak selalu demikian. Para sponsor memiliki agenda politik dan birokratisnya sendiri, dan pihak ini mungkin lebih tertarik pada jaminan bahwa implementasi dan komitmen pendanaannya tepat waktu dibandingkan dengan keakuratan kegiatan proyek.

Bagian Pertama: Konsep-konsep Elementer

Keempat , para pengambil keputusan tingkat-atas pada pemerintahan dan agen pemberi donor sering tidak ingin

diganggu oleh urusan sehari-hari manajemen program. Setelah perencanaan dan program awal disetujui, perhatian mereka bergeser pada upaya untuk memantau keluaran proyek.

Evaluasi sumatif atau produk dilaksanakan pada sebagian besar program bantuan teknis internasional sebagai satu

persyaratan dari kelompok yang memberi donor atau kelompok sponsor. Rencana untuk evaluasi sumatif pada umumnya dikembangkan dan tercakup di dalam deskripsi proyek awal pada saat keputusan pembiayaannya.

Menurut teori, evaluasi produk mempunyai audiensi terbesar dibandingkan dengan berbagai tipe evaluasi yang telah diuraikan di muka, namun praktiknya sering mendapatkan audiensi terkecil. Hasil evaluasi proyek merupakan bagian potensial dari kepentingan sponsor, mereka yang mengimplementasikan program, dan kepentingan berbagai kelompok partisipan yang diminta untuk menginvestasikan waktu, minat atau sumberdayanya. Kelompok-kelompok ini ingin mengetahui pengaruh apa yang diperoleh dan hasil apa yang dicapai. Mereka sering berupaya mendapatkan konfirmasi untuk apa yang sudah mereka yakini sehubungan dengan program berdasarkan pada pengalamannya sendiri.

Meskipun demikian, audiensi utama evaluasi produk seharusnya menjadi perencana proyek masa depan yang mungkin tertarik untuk bisa mereplikasikan keberhasilan komponen program terdahulu. Sampai pada taraf pelaksanaan replikasi, evaluasi ikut menyumbang tingkat pengetahuan kumulatif sehubungan dengan strategi pembangunan internasional dan dapat mempersembahkan sumbangan yang berharga pada berbagai upaya desain proyek berikutnya. Kenyataannya, alasan kecilnya jumlah audiensi evaluasi produk adalah karena demikian seringnya replikasi proyek terdahulu.

Evaluasi Program: Teks Pilihan untuk Pemula

Kecenderungan ini dapat dijelaskan dengan tiga alasan penyebabnya. Pertama, konteks sosial, ekonomi, dan politik demikian luas perbedaannya dari negara yang satu ke negara yang lain, sehingga walaupun konsep umum dapat diterapkan pada berbagai setting, namun kespesifikan program membatasi penerapannya. Kedua, tim desain proyek melaksanakan sebagian besar pekerjaannya di lapangan, jauh dari segala kemudahan untuk membuat laporan evaluasi yang mungkin relevan dan menguntungkan bagi mereka. Biasanya mereka bekerja dengan keterbatasan waktu yang tidak memungkinkannya mencari berbagai hasil temuan yang relevan dari evaluasi produk sebelumnya yang lebih awal. Ketiga , laporan evaluasi sumatif kadangkala ditulis dengan cara atau teknik yang ‘mengecilkan’ kegunaannya. Perhatian lebih banyak dicurahkan untuk analisis dan laporan hasilnya, sedangkan paparan proses program yang cukup terinci, yang memungkinkan terjadinya pemahaman pada apa yang sebenarnya terjadi di dalam proyek tersebut, kurang diperhatikan.

TINJ TINJA TINJ TINJ TINJ A A AU A U U U UAN HIST AN HIST AN HIST AN HIST AN HISTORIS ORIS ORIS ORIS ORIS MAD MAD MAD MAD MADA A A A AUS, US, US, STUFFLEBEAM, US, US, STUFFLEBEAM, STUFFLEBEAM, STUFFLEBEAM, STUFFLEBEAM, D D D DAN SCRIVEN D AN SCRIVEN AN SCRIVEN AN SCRIVEN AN SCRIVEN

Menurut Madaus, Stufflebeam, dan Scriven, ada 6 periode dalam seluruh kehidupan evaluasi program. Periode pertama, adalah periode sebelum 1900, yang disebut masa reformasi ; yang kedua, dari tahun 1900 sampai 1930, yang disebut sebagai masa efisiensi dan pengujian; yang ketiga, dari tahun 1930 sampai 1945, yang biasa disebut masa Tylerian; yang keempat, dari tahun 1946 sampai sekitar tahun 1957, yang disebut dengan masa innocence; yang kelima, dari tahun 1958 sampai 1972, adalah masa ekspansi; dan akhirnya yang keenam, dari tahun 1973 sampai sekarang adalah masa profesionalisasi .

A. MASA REFORMASI 1800 – 1900

Periode sejarah evaluasi program ini mencakup abad kesembilan belas. Masa ini adalah masa Revolusi Industri dengan berbagai perubahan ekonomi dan teknologi yang menyertainya, yang mentransformasikan hampir semua

Evaluasi Program: Teks Pilihan untuk Pemula

struktur masyarakat. Mengutip Pinker (1971) 1 , mereka mengatakan bahwa masa ini adalah periode perubahan sosial yang utama, reformasi dan revisionisme yang berhati-hati. Masa ini merupakan masa perubahan drastis dari segi penampilan dan kesehatan mental, kehidupan dan kesadaran sosial, serta dari segi keseluruhan struktur agen sosial. Pada masa inilah berdengung filsafat laissez-faire Bentham dan filsafat humanitarian para philanthropists (dermawan). Ini merupakan periode yang ditandai oleh berbagai upaya berkesinambungan namun sering berlarut-larut dalam mereformasi program pendidikan dan sosial serta berbagai agensi baik di Inggris maupun di Amerika Serikat.

Di Inggris selama abad ke-19 berlangsung upaya yang berkelanjutan untuk mereformasi pendidikan, hukum yang tak berkeadilan, rumah sakit, rumah yatim-piatu, dan kesehatan masyarakat. Evaluasi terhadap badan dan fungsi sosial ini sifatnya informal dan impressionistis (lebih memberikan ide umum daripada fakta khusus). Sering evaluasi itu berbentuk komisi pemerintah yang ditunjuk untuk menyelidiki berbagai aspek dari bidang yang sedang dipertimbangkan. Misalnya, Komisi Kerajaan (Royal Commission) untuk investigasi Primary Education di Irlandia di bawah pimpinan the Earl of Powis, setelah menerima kesaksian dan bukti penelitian, menyimpulkan bahwa “kemajuan anak-anak pada sekolah nasional di Irlandia berada jauh di bawah standar yang diharapkan.” Untuk memulihkannya, komisi Powis lalu merekomendasikan skema “payment by results” (pengupahan berdasarkan pada hasil) yang sudah diterapkan di Inggris, dan yang menggantungkan gaji guru sebagian pada hasil ujian tahunan di bidang membaca, mengeja, menulis, dan aritmetika

(Kellaghan & Madaus, 1982). 2 Contoh lain dari pendekatan

1 Pinker , R. (1971). Social theory and social policy. London: Heinemann Educational Books.

2 Kallaghan, T. & Madaus, G.F. (1982). Trends in educational standards in Great Britain and Ireland . Dalam G.R. Austin & H. Garber. The rise and fall of

National Test Scores. New York: Academic Press.

Bagian Pertama: Konsep-konsep Elementer

evaluasi ini adalah Komisi Kerajaan tahun 1882 untuk Rumah Sakit Cacar dan Demam yang merekomendasikan bahwa rumah sakit untuk penyakit menular seharusnya terbuka dan bebas bagi semua warga negara (Pinker, 1971). 3

Saat ini, Komisi Kerajaan masih digunakan di Inggris, untuk mengevaluasi berbagai bidang yang sedang menjadi perhatian. Imbangan padanannya di AS adalah Komisi Kepresidenan (misalnya, Komisi Kepresidenan untuk Pendanaan Sekolah), White House Panels (misalnya, panel gedung putih untuk Non Public Education), dan dengar pendapat Konggres. Di sepanjang sejarahnya, Komisi Kerajaan, Komisi Kepresidenan, Dengar pendapat Kongres telah berfungsi sebagai alat untuk mengevaluasi berbagai program layanan kemanusiaan melalui bukti penelitian yang dikumpulkan oleh komisinya atau yang disajikan oleh berbagai pihak yang berkepentingan. Meskipun demikian, pendekatan terhadap evaluasi ini kadang-kadang hanya bersifat emblematic (perlambang) atau simbolis.

Di Inggris, selama periode ini, pada saat berbagai program reformasi ditata, bukan hal yang aneh bila ada permintaan evaluasi setiap tahun melalui sistem laporan tahunan yang disampaikan oleh inspektorat. Misalnya, dalam pendidikan terdapat beberapa inspektur sekolah yang tugasnya mengunjungi sekolah setiap tahunnya dan memberikan laporan mengenai kondisi dan prestasi siswa. Serupa dengan itu, para komisioner Poor Law punya inspektur kecil yang diupah untuk mengawasi kepatuhan pada UU Amandemen

Poor Law tahun 1834 (Pinker, 1971). 4 Sistem pemeliharaan inspektorat eksternal untuk memeriksa dan mengevaluasi upaya sekolah saat ini terdapat di Inggris dan Irlandia. Di AS, para inspektur eksternal dipekerjakan pada beberapa negara dan badan federal. Misalnya, OSHA (Occupational Safety and Health Administration ) mempekerjakan para inspektur untuk

3 Op. Cit. 4 Ibid.

Evaluasi Program: Teks Pilihan untuk Pemula

memantau ancaman kesehatan di tempat kerja. Menariknya, sistem inspektur eksternal sebagai model evaluasi hanya mendapat perhatian kecil di dalam pustaka mengenai evaluasi. Bidang evaluasi pendidikan dapat memperoleh keuntungan dari observasi lebih detil terhadap sistem inspektorat formal.

Dalam sejarah evaluasi, sepanjang periode ini, perlu diperhatikan dua perkembangan lain di Inggris. Pertama, selama pertengahan abad ke-19 muncul sejumlah asosiasi yang dibentuk untuk investigasi sosial. Asosiasi ini menemukan dan mempublikasikan beberapa persoalan sosial yang sangat besar pengaruhnya untuk merangsang pembahasan. Kedua, sering dalam menjawab private reports ini, birokrasi yang dibentuk untuk mengelola program sosial kadangkala mengangkat komite investigasi. Komite ini merupakan komite investigasi resmi yang disponsori pemerintah untuk program sosial, seperti provincial workhouses (Pinker, 1971). Kedua contoh ini penting dengan dasar alasan bahwa contoh itu merupakan benih lahirnya pendekatan empirisme terhadap evaluasi program.

Di AS, mungkin upaya formal paling awal untuk mengevaluasi kinerja sekolah muncul di Boston pada tahun 1845. Peristiwa ini, dalam sejarah evaluasi termasuk peristiwa penting karena merupakan awal dimulainya tradisi panjang pemakaian skor tes siswa sebagai sumber data pokok untuk mengevaluasi efektivitas program sekolah atau pengajaran. Lalu, atas desakan Samuel Gridley, diperkenalkan ujian essei tertulis di Boston Grammar Schools oleh Horace Mann dan Board of Education . Seolah-olah ujian essei diperkenalkan untuk mengganti ujian lisan atau viva voce. Modus ujian yang terakhir ini, dengan semakin banyaknya siswa, secara administratif menjadi janggal dan juga dianggap tidak adil karena tak dapat distandardisasikan untuk semua siswa. Hal yang menarik mengenai evaluasi program adalah agenda kebijakan tersembunyi di balik pergeseran menuju ujian tertulis, yaitu, pengumpulan data agar dapat dilakukan perbandingan antar- sekolah yang pada akhirnya dapat digunakan dalam berbagai keputusan mengenai pengangkatan kepala sekolah. Howe dan

Bagian Pertama: Konsep-konsep Elementer

Mann mencoba membangun differential school effects dan menggunakan data ini untuk menyingkirkan kepala sekolah yang menentang mereka dalam hal penghapusan hukuman badan. Ini merupakan contoh awal yang menarik mengenai politisasi data evaluasi.

Antara tahun 1887 dan 1898, Joseph Rice melaksanakan apa yang pada umumnya dikenal sebagai evaluasi program pendidikan formal yang pertama di Amerika. Ia melakukan kajian komparatif mengenai nilai drill (latihan) dalam pengajaran spelling (mengeja) pada sejumlah school districts. Ia menggunakan skor tes sebagai ukuran kriterianya dalam evaluasi pengajaran mengeja. Ia berpendapat bahwa tak ada perolehan pembelajaran yang signifikan antara sistem yang membutuhkan waktu 200 menit seminggu untuk belajar mengeja dengan yang hanya menggunakan waktu sedikitnya

10 menit/minggu. Akibatnya, Rice berhasil mendorong para pendidik untuk menguji-ulang dan akhirnya merevisi pendekatan yang dipakai untuk pengajaran mengeja. Hal yang lebih penting dari sudut pandang sejarah evaluasi program ini adalah argumentasinya bahwa para pendidik harus menjadi tenaga ahli di bidang eksperimen dan sebagai pemikir kuantitatif, juga pemakaian desain riset komparatif untuk mengkaji prestasi siswa. Rice adalah pendahulu pendekatan desain eksperimen pada evaluasi yang pertama-tama diajukan oleh Linquist pada 1953 dan diperjuangkan oleh Campbell & Stanley pada 1963, 1969. dan pada tahun 1970-an.

Perkembangan lain seharusnya disebutkan sebelum meninggalkan pembahasan singkat mengenai apa yang dicirikan sebagai abad reformasi. Dasar akreditasi atau pendekatan judgement profesional pada evaluasi secara langsung dapat ditelusuri ke pembentukan North Central Association of Colleges & Secondary Schools di akhir tahun 1980- an. Meskipun demikian, gerakan akreditasi tidak mendapat reputasi yang cukup baik hingga tahun 1930-an ketika dibentuk enam asosiasi akreditasi regional di seluruh negeri. Sejak itu gerakan akreditasi meluas dan memperoleh pengaruh

Evaluasi Program: Teks Pilihan untuk Pemula

serta kredibilitas yang besar sebagai sarana pokok untuk mengevaluasi keandalan institusi pendidikan.