DALAM beberapa minggu ke depan, semua satuan pendidikan akan disibukkan kembali dengan berbagai kegiatan persiapan dan pelaksanaan penilaian akhir tahun ajaran. Hasil penilaian yang akan digunakan sebagai dasar dalam memuat keputusan kelulusan siswa. Sebelumnya, satuan pendidikan menerima perangkat penilaian–ujian nasional (UN)–yang sudah disiapkan Badan Standar Nasional Pendidikan (BSNP). Namun, sejak merebaknya pandemi covid-19, pada semester kedua tahun ajaran 2019/2020, keadaannya berubah. Satuan pendidikan harus menyiapkan sendiri alat penilaian yang dibutuhkan untuk kebijakan penetapan kelulusan siswa. Sampai tahun ajaran 2020/2021 keadaannya juga masih belum berubah sehingga satuan pendidikan tetap diminta menyiapkan sendiri instrumen penilaian kelulusan. Untuk keperluan itu, Kemendikbud sudah mengeluarkan panduan umum tentang berbagai instrumen penilaian dan penugasan yang dapat digunakan untuk mengumpulkan data dan informasi hasil pembelajaran yang akan digunakan sebagai dasar penentapan kelulusan siswa.

Pengalaman satuan pendidikan (guru dan manajemen) dalam mengembangkan instrumen penilaian, menyeleng­garakan, menafsirkan, dan menggunakan hasil penilaian untuk tujuan kelulusan, sebenarnya relatif baru dan sangat terbatas. Dibutuhkan panduan teknis yang lebih konkret, jelas, dan dapat digunakan sehingga kesalahan dan/atau penyalahgunaan hasil penilaian yang berpotensi merugikan siswa dapat diminimalisasi.

Penyalahgunaan penilaian Penyalahgunaan dalam menafsirkan dan memanfaatkan data dan informasi hasil penilaian akan dapat memengaruhi motivasi belajar dan karier pendidikan siswa. Data dan informasi hasil penilaian akan menjadi masukan yang berguna dalam pembuatan kebijakan pendidikan (kenaikan atau kelulusan) siswa jika digunakan secara layak (appropriate) dan sesuai tujuan. Benar adanya, sebuah instrumen penilaian yang dirancang untuk satu tujuan tertentu. Namun, hasilnya juga dapat digunakan untuk keperluan atau tujuan lainnya karena setiap instrumen penilaian akan mengandung tingkat bukti validitas (degrees of validity evidence) terlepas dari apa tujuan diselenggarakannya penilaian tersebut. Hanya, kesimpulan tentang siswa yang dibuat berdasarkan data dan informasi hasil penilaian yang terbatas, dikaitkan dengan tujuan diselenggarakannya penilaian, dipastikan masih sangat belum memadai. Maka, dibutuhkan data dan informasi hasil belajar lainnya yang dapat dihimpun/diperoleh dari instrumen penilaian berbeda dan/atau dalam bentuk penugasan.

Setiap tujuan penilaian membutuhkan bukti validitas (validity evidence) tersendiri yang tergambar dari butir-butir soal yang digunakan. Setiap instrumen penilaian pendidikan yang dikembangkan dan digunakan guru atau lembaga (penilaian) eksternal, hanya mengukur beberapa atau sebagian besar perilaku, tapi tidak semua perilaku (behaviors). Oleh karena itu, mengatakan sebuah instrumen penilaian dapat menjelaskan semua perilaku yang diukur (one test fits for all) ialah pernyataan yang menyesatkan (misleading). Guru (pengguna) perlu berhati-hati saat menginterpretasikan dan memanfaatkan hasil penilaian siswa karena data dan informasi tersebut tidak sepenuhnya mampu menggambarkan kinerja siswa secara utuh.   Penyalahgunaan umum Penyalahgunaan data dan informasi hasil penilaian bisa terjadi pada siapa saja yang profesinya terkait dengan dunia pendidikan dan dunia kerja/perkantoran. Apakah untuk kepentingan promosi sekolah atau kantor, seleksi, wisuda, dan keperluan lainnya. Menurut Eric Gardner (1989), hasil penilaian bisa dibagi menjadi lima penyalahgunaan umum. Pertama, penerimaan (tanpa sikap kritis) terhadap judul instrumen penilaian sebagai peruntukan yang hendak diukur.

Menurut Gardner, terdapat kecenderungan terutama pengguna instrumen penilaian yang tidak begitu canggih (sophisticated) untuk menerima nama yang diberikan ke suatu alat penilaian dipandang sebagai deskripsi yang akurat dan lengkap dari variabel yang hendak diukur. Karena judul harus singkat, judul tidak dapat menginfor­masikan semua yang perlu diketahui pengguna/pemakai alat penilaian tentang jenis perilaku yang akan diukur. Terdapat begitu banyak aspek kemampuan kognitif sehingga sangat jelas bahwa tidak ada tes yang dapat mengukur kesemuanya. Hanya pengetahuan yang baik tentang butir-butir soal (items) yang dapat mengungkapkan apa yang sedang diukur. Selain itu, situasi penilaian juga mungkin sepenuhnya mengubah perilaku yang diharapkan. Gardner memberi contoh, ketika seorang penutur non-Inggris atau siswa tunanetra diberi penilaian/tes ‘bakat’ dalam bahasa Inggris tercetak, itu jelas tidak mengukur aspek ‘bakat’ atau ‘kecerdasan’ apa pun, kecuali kurangnya pengetahuan bahasa Inggris atau kurangnya penglihatan. Contoh meyakinkan lainnya, ia menyebutkan bahwa untuk sebuah tes prestasi belajar tidak berarti bahwa tes tersebut akan berfungsi seperti itu dalam semua keadaan pada semua siswa. Dengan demikian, kegagalan untuk memeriksa manual dan butir soal dengan hati-hati untuk mengetahui aspek tertentu dari kemampuan kognitif yang akan dinilai, dapat mengakibatkan penyalahgunaan berdasarkan pemilihan alat penilaian/tes yang tidak sesuai untuk tujuan atau situasi tertentu. Kedua, mengabaikan kesalahan pengukuran pada skor tes/penilaian.

Baca Juga: Tuah Sakti Perikanan

Setiap skor tes/penilaian mengandung kesalahan pengukuran (error of measurement). Merupakan penyalahgu­naan skor tes atau observasi apa pun, untuk menerima skor tes sebagai indeks tetap dan tidak berubah yang tidak mengandung kesalahan. Tidak mungkin untuk mengatakan dengan pasti bahwa skor yang diamati seseorang memberikan kinerja sebenarnya pada domain umum tentang kesimpulan mana yang akan dibuat. Ketiga, penggunaan skor tes tunggal untuk pengambilan keputusan. Penyalahgunaan tes/penilaian terjadi ketika skor tidak dipertimbangkan dan diinterpre­tasikan dalam konteks penuh dari berbagai elemen yang menjadi ciri siswa, guru, dan lingkungan pendidikan umum yang terlibat karena skor tes/penilaian itu hanya mewakili sampel dari domain terbatas dan tidak mencakup berbagai faktor yang mungkin memengaruhi skor itu. Misalnya, dalam keputusan untuk lulus atau tidak lulus siswa pendidikan menengah, skor (hasil ujian bersama) tidak boleh digunakan secara terpisah dan bahkan seharusnya digunakan bersama dengan catatan sekolah menengah siswa dan data relevan lainnya, seperti esai panjang, proyek laporan, referensi/rekomendasi guru tentang motivasi, kemampuan kepemim­pinan, kreativitas, dan keterlibatan dalam kegiatan ekstrakurikuler. Keempat, kurangnya pemahaman tentang pelaporan skor tes/penilaian.

Terdapat kesalahpahaman yang substansial, tidak hanya terjadi di kalangan masyarakat awam, tetapi juga di antara kalangan para pendidik, tentang arti skor tes/penilaian. Kebanyakan orang percaya bahwa mereka memahami arti dari skor mentah atau skor mentah tertentu yang diubah menjadi persen dari butir soal yang dijawab dengan benar, seperti dalam banyak kasus tes/penilaian yang mengacu pada kriteria (criterion-referenced measurement). Bahkan, dalam ilustrasi yang paling sederhana ini, sebenarnya lebih banyak yang terlibat daripada yang sekadar ditunjukkan satu nomor soal. Empat puluh lima (45) butir soal dijawab benar dari lima puluh butir soal dengan kategori mudah memiliki arti yang sangat berbeda dari empat puluh lima (45) butir soal yang dijawab dengan benar dari sampel lima puluh (50) butir soal kategori sangat sulit dari domain yang sama. Kelima, mengaitkan penyebab perilaku yang diukur untuk diuji.

Skor tes ialah deskripsi numerik dari sampel kinerja pada suatu titik waktu tertentu. Skor tes tidak memberikan informasi mengapa individu tersebut berprestasi seperti yang dilaporkan. Mengklaimnya sebagai penjelasan prestasi, apakah dimak­sudkan sebagai atribut positif atau kritik, sama saja dengan menguji penyalahgunaan. Lima penyalahgunaan umum hasil tes berpotensi terjadi pada siswa di setiap jenjang pendidikan yang berpartisipasi pada ujian akhir. Oleh karena itu, sangat disarankan para pengguna instrumen tes/penilaian (guru dan manajemen) untuk secara hati-hati menyimpulkan dan menggunakan hasilnya sehingga siswa dapat menerima perlakuan dengan objektif dan adil. Wallahualam.( Syamsir Alam, Divisi Kurikulum dan Penilaian Yayasan Sukma)