A. Hakikat
dan Fungsi Penilaian
Penilaian berurusan dengan
data kuantitatif dan kualitatif, sedang pengukuran yang hanya bagian penilaian
itu selalu berhubungan dengan data kuantitatif. Penilaian memerlukan data
kuantitatif dari pengukuran. Sebaliknya, pengukuran juga sangat terikat pada
penilaian khusus yang berkaitan dengan masalah tujuan dan kriteria yang
dipergunakan.
Penilaian adalah proses
memperoleh dan mempergunakan infomasi untuk membuat pertimbangan yang
dipergunakan sebagai dasar pengambilan informasi. Dengan demikian, terdapat
tiga komponen penting penilaian, yaitu informasi, pertimbangan, dan keputusan.
Informasi memberikan
data-data (baik kuantitatif maupun kualitatif) yang berguna untuk pembuatan
pertimbangan. Pertimbangan dimungkinkan tepat jika informasi yang diperoleh dan
interpretasi terhadapnya juga tepat. Pertimbangan adalah taksiran kondisi yang
ada kini dan prediksi keadaan pada masa mendatang. Keputusan yang diambil
berdasarkan kedua komponen tersebut adalah pilihan di antara berbagai arah
tindakan atau sejumlah alternatif yang ada.
Langkah-langkah penilaian
menurut Buchori (1972) adalah persiapan (berisi penetapan tujuan, aspek yang
dinilai, metode, penyusunan alat, penetapan kriteria, dan frekuensi penilaian),
pengumpulan data, pengolahan data hasil penilaian, penafsiran, dan penggunaan
hasil.
Langkah-langkah penilaian
menurut Ten Brink (1974) terdiri dari tahap persiapan yang berupa pemerincian
pertimbangan dan keputusan yang akan dibuat, informasi yang diperlukan dan pemanfaatan
yang ada, penentuan waktu dan cara, dan penyusunan alat, tahap pengumpulan data
yang diteruskan analisis terhadapnya, dan tahap penilaian yang berupa pembuatan
pertimbangan dan keputusan, dan diteruskan dengan pembuatan laporan hasil
penilaian.
Tujuan dan fungsi penilaian
antara lain adalah untuk mengetahui kadar pencapaian tujuan, memberikan sifat
objektivitas pengamatan tingkah-laku hasil belajar siswa, mengetahui kemampuan
siswa dalam hal-hal tertentu, menentukan layak tidaknya seorang siswa
dinyatakan naik kelas atau lulus, dan untuk memberikan umpan balik bagi
kegiatan belajar mengajar yang dilakukan.
Pengukuran dilakukan hanya
dengan mengambil sample tentang suatu hal yang akan diketahui karena tak
mungkin mengukur semua kemampuan siswa, dan siswa sendiri tak mungkin menunjukkan
semua kemampuannya.
B. Tujuan Pembelajaran
dan Penilaian
Tujuan memberi arah dan
pegangan yang jelas, memaksa kita untuk berpijak pada kenyataan dan berpikir
secara konkret. Tujuan bagi guru akan membantu untuk memilih bahan, metode,
teknik, dan alat evaluasi, sedang bagi murid, la dapat dimanfaatkan sebagai
pengorganisator dan kerangka kerja untuk memperoleh ilmu.
Tujuan pembelajaran dan keluaran
hasil belajar adalah dua hal yang erat berkaitan. Tujuan menyarankan
bentuk-bentuk tertentu keluaran belajar, sebaliknya, tingkah laku keluaran
belajar merupakan realisasi pencapaian tujuan.
Keluaran belajar oleh Gagne
dibedakan dalam bentuk keterampilan intelektual (yang berisi kemampuan
membedakan, konsep, aturan, dan aturan tingkat tinggi), strategi kognitif,
informasi verbal, keterampilan motor, dan sikap. Pembagian Bloom yang terkenal
dengan sebutan taksonomi Bloom yang terdiri dari aspek kognitif, afektif, dan
psikomotor banyak diikuti orang, termasuk kurikulum di Indonesia .
Proses identifikasi tujuan
khusus merupakan proses analisis dan identifikasi keluaran belajar. Tujuan
khusus (behavioral objectives) menyaran pada tingkah laku keluaran belajar
yang operasional, artinya mudah diamati diukur dengan alat penilaian.
Tiap tujuan khusus harus
mengandung unsur sasaran, tingkah laku yang diharapkan, kondisi sewaktu
dinilai, dan kriteria keberhasilan. Tidak seperti halnya tujuan umum, tujuan
khusus mempunyai cakupan bahan yang terbatas.
Penyusunan alat penilaian
harus mendasarkan diri pada tujuan agar dapat berfungsi sebagaimana mestinya.
Alat penilaian dikatakan memenuhi kriteria kelayakan jika dapat mengukur keluaran
belajar yang konsisten dengan tujuan. Tujuan akan menentukan tingkah laku guru
dan murid dan bentuk keluaran belajar yang terukur.
Bahan pembelajaran merupakan
pengantara tujuan dan alat penilaian, merupakan sarana tercapainya tujuan dan
sumber penyusunan alat penilaian. Karena bahan memegang peranan penting, ia
perlu dideskripsikan secara terinci karena hal itu juga dapat dimanfaatkan
untuk menguji kesahihan isi alat penilaian itu sendiri.
Pemilihan jenis alat
penilaian harus disesuaikan dengan tingkah laku keluaran belajar yang ditunjuk
oleh tujuan, baik itu yang berkaitan dengan kemampuan kognitif, tingkah laku
efektif, maupun psikomotor. Jenis penilaian mungkin berupa lisan atau tertulis,
observasi, wawancara, perbuatan, dan sebagainya.
Tingkatan penilaian
terutama dikaitkan dengan aspek kognitif yang terdiri dari tingkatan
pengetahuan (ingatan), pernahaman, penerapan, analisis, sintesis, dan evaluasi.
Kegiatan penilaian umumnya hanya ditekankan pada (sampai dengan) tingkatan
ingatan dan pernahaman saja. Aktivitas kognitif yang lebih tinggi tingkatannya
dan lebih penting dalam kaitannya dengan tujuan pendidikan justru sering tidak
nampak dalam penilaian.
Penyusunan alat penilaian
seharusnya mencakup keenam tingkatan aspek kognitif itu, tetapi dengan
memperhatikan perimbangan bobotnya, yaitu sesuai dengan tingkat perkembangan
kognitif siswa. Semakin tinggi tingkat kemampuan kognitif siswa, semakin
tinggi pula penilaian daya kognitif yang diberikan.
Tabel spesifikasi atau
kisi-kisi berisi perincian pokok bahasan yang diteskan, tingkat kemampuan
kognitif yang diukur, perimbangan dan jumlah soal per tingkatan aspek kognitif
dan pokok bahasan (per sel), dan persentase atau jumlah soal pertingkatan
kognitif, per pokok bahasan, dan seluruh butir soal.
Pengisian jumlah atau bobot
tiap sel dengan mempertimbangkan tingkatan aspek kognitif yang diungkap dan
keadaan pokok bahasan. Pertimbangan pertama berkaitan dengan aspek kejiwaan
siswa tentang tingkat perkembangan kognitifnya, yaitu yang akan dipakai untuk
menentukan bobot per tingkatan aspek kognitif. Pertimbangan kedua mencakup
peranan dan cakupan bahan yang dipakai untuk menentukan bobot tiap pokok
bahasan.
Tabel spesifikasi berguna
untuk memberi rambu-rambu kepada penyusun alat tes agar tidak hanya memfokuskan
diri pada satu atau beberapa pokok bahasan dan tingkatan-tingkatan aspek
kognitif sederhana saja. Di samping itu, ia juga akan memberi petunjuk sel-sel
mana saja yang telah dibuat alat tesnya dan mana yang belum atau masih kurang.
C. Alat Penilaian
Teknik nontes misalnya
berupa kegiatan kuesener, wawancara, pengamatan, dan pengukuran kecenderungan
tertentu dengan mempergunakan skala. Skala merupakan suatu kesatuan sebagai
penanda unit-unit yang bersifat angka yang disusun secara berjenjang, tiap
jenjang melambangkan sikap dan keyakinan tertentu.
Teknik wawancara baik
secara bebas maupun terpimpin, dalam kaitannya dengan penilaian kebahasaan,
dapat dipergunakan juga untuk menilai keterampilan, kelancaran, dan kefasihan
berbicara siswa dalam bahasa yang diajarkan.
Kegiatan pengamatan baik
yang berstruktur maupun tak berstruktur dapat dimanfaatkan untuk menilai
tingkah laku hasil belajar bahasa siswa yang terlihat dalam kegiatan
sehari-hari. Tingkah laku dalam situasi seperti itu bersifat wajar, tidak
dibuat-buat, dan lebih mencerminkan keadaan yang sesungguhnya.
Tes adalah seperangkat
tugas atau pertanyaan yang dipergunakan untuk mengukur keterampilan,
pengetahuan, intelegensi, kemampuan, atau bakat yang dimiliki seseorang atau
kelompok. Dan segi jawaban siswa, tes dapat dibedakan ke dalam tes perbuatan
dan tes verbal.
Tes buatan guru disusun
berdasarkan tujuan-tujuan khusus dan deskripsi bahan yang disusun guru untuk
mengukur keberhasilan siswa mencapai tujuan, jadi yang terpenting dapat
dipertanggungjawabkan dari jenis kesahihan isi. Tes buatan guru biasanya tingkat
ketepercayaannya rendah atau tak diketahui.
Tes standar disusun
berdasarkan tujuan-tujuan umum seperti yang terdapat dalam kurikulum. Oleh
karena telah mengalami beberapa kali uji coba dan revisi, tes standar dapat
dipertanggungjawabkan dari segi kelayakan, kesahihan, ketepercayaan, dan
ketertafsiran. Tes standar berguna untuk melengkapi informasi tertentu tingkat
hasil belajar siswa, membuat perbandingan prestasi siswa, dan berfungsi
diagnostik.
Tes kemampuan awal dapat
dibedakan menjadi pretes, yang dimaksudkan untuk mengetahui kemampuan siswa
sebelum mengalami proses belajar, tes prasyarat, yang dimaksudkan untuk
mengetahui kemampuan tertentu disyaratkan untuk masuk pendidikan tertentu, dan
tes penempatan yang dimaksudkan untuk menempatkan siswa sesuai dengan
kemampuannya.
Tes diagnostik dimaksudkan
untuk menemukan kelemahan-kelemahan siswa dalam hal tertentu untuk kemudian
diremidi. Tes formatif dimaksudkan untuk mengukur kadar keberhasilan siswa
mencapai tujuan yaitu berkaitan dengan pokok bahasan yang baru saja
diselesaikan dalam proses belajar mengajar. Bagi guru tes formatif dapat untuk
menilai efektivitas pengajaran, sedang bagi siswa dapat berfungsi sebagai
penguat.
Tes sumatif dimaksudkan
untuk mengukur kadar pencapaian siswa terhadap tujuan umum, yang meliputi
seluruh bahan yang diprogramkan pada periode tertentu. Informasi tes sumatif
dipergunakan untuk menentukan prestasi siswa, naik-tidak dan atau lulus tidak-nya
seorang siswa, serta untuk membuat laporan kepada pihak tertentu.
Tes esai merupakan tes
proses berpikir yang melibatkan aktivitas kognitif tingkat tinggi, menuntut
kemampuan siswa untuk menerapkan pengetahuan, menganalisis, menghubungkan
konsep-konsep, menilai, dan memecahkan masalah.
Kelemahan pokok tes esai
adalah rendahnya kadar kesahihan dan ketepercayaan akibat terbatasnya sampel
bahan, jawaban siswa yaitu bervariasi, dan penilaian yang bersifat subjektif.
Untuk mengurangi sifat subjektif dalam penilaian, perlu ditentukan kriteria
penilaian yang menyangkut isi, organisasi, proses, kesimpulan dan alasan dengan
bobot yang tidak harus sama.
Tes objektif menghendaki
hanya satu jawaban yang benar, maka penilaiannya dapat secara objektif, cepat,
dan dapat dipercaya. Karena jumlah soal relatif banyak, tes objektif dapat mencakup
bahan secara lebih menyeluruh.Tes objektif yang baik tidak mudah disusun,
memerlukan waktu lama, dan ada kecenderungan guru hanya terpusat pada pokok bahasan
dan tingkatan aspek kognitif tertentu. Dalam mengerjakannya, siswa dapat
bersifat untung-untungan.
Tes objektif dapat berupa
benar-salah, pilihan ganda, melengkapi, dan penjodohan. Tes benar-salah bisa
dipakai karena hasil belajar yang berupa penguasaan pengetahuan verbal yang
dinyatakan dalam bentuk proposisi dapat dinyatakan secara benar atau salah.
Tes pilihan ganda merupakan tes benar-salah dengan pernyataan salah lebih
banyak. Tes isian adalah tes pilihan ganda tapi siswa mengisi sendiri pilihan
yang benar, sedang penjodohan semua pernyataan yang benar ditunjukan sekaligus.
Tes objektif jenis
benar-salah dan pilihan ganda dapat diskor dengan rumus tanpa tebakan dan
tebakan (yaitu memberlakukan semacam denda), sedang jenis isian dan penjodohan
umumnya diskor dengan tanpa tebakan.
Tes yang baik adalah yang
dapat dipertanggungjawabkan dari segi kelayakan (appropriateness), kesahihan
(validity), ketepercayaan (reliability), efektivitas butir soal, dan
kepraktisan (practicality). Kelayakan tes berkaitan dengan masalah apakah
suatu tes dapat mengukur keluaran hasil belajar yang konsisten dengan tujuan;
apakah semua tujuan telah mempunyai alat ukur yang sesuai; apakah jumlah butir
soal per tujuan telah mencerminkan kadar pentingnya tujuan; dan apakah semua
butir soal telah mengacu ke tujuan tertentu?
Butir-butir tes harus
mencerminkan bahwa pelajaran yang diajarkan. Semua bahan yang diajarkan perlu
diambil tesnya, dan sebaliknya, tes harus hanya terbatas pada bahan yang
diajarkan. Untuk memudahkan pengecekan hal itu, pembuatan soal hendaknya
mendasarkan diri pada tabel spesifikasi. Kelayakan tes dalam hal ini, merupakan
salah satu jenis kesahihan, kesahihan isi.
Kesahihan tes, tes menunjuk
pada pengertian apakah suatu tes dapat mengukur apa yang akan diukur. Tes yang
sahih akan dapat membedakan siswa yang memang berkemampuan yang lebih baik daripada
yang sebaliknya. Kesahihan tes yang baik akan mengungkap semua tingkatan aspek
kognitif, dan tidak hanya terbatas pada beberapa tingkatan kognitif yang
sederhana saja.
Kesahihan tes dibedakan
berdasarkan analisis rasional, kesahihan isi dan konstruk atau konsep, dan
berdasarkan data empirik, kesahihan serentak dan ramalan, serta kesahihan
kriteria atau ukuran.
Kesahihan isi menunjuk pada
pengertian apakah suatu tes mempunyai kesejajaran dengan tujuan deskripsi
bahan yang diajarkan. Tujuan dan bahan biasanya dikembalikan kepada kurikulum,
maka kesahihan isi disebut juga sebagai kesahihan kurikuler. Di pihak lain,
kesahihan konstruk menunjuk pada pengertian apakah tes yang disusun telah
sesuai dengan konstruk ilmu bidang studi yang diteskan.
Kesahihan ukuran
mempermasalahkan seberapa jauh siswa yang sudah diajar dalam bidang tertentu
mempunyai kemampuan yang tinggi daripada yang belum diajar. Jika subjeknya
sama, membandingkan hasil belajar itu dapat mendasarkan diri pada hasil pretes
dan postes.
Kesahihan sejalan menunjuk
pada pengertian apakah tingkat kemampuan seseorang pada suatu bidang yang
diteskan sesuai dengan skor bidang-bidang lain yang mempunyai persamaan karakteristik.
Di pihak lain, kesahihan ramalan mempermasalahkan apakah sebuah tes mempunyai
kemampuan untuk meramalkan prestasi yang akan dicapai kemudian. Pengujian
terhadap kedua jenis kesahihan ini dilakukan dengan teknik korelasi.
Pengujian kesahihan dalam
berbagai jenis di atas merupakan pengujian kesahihan secara keseluruhan. Pengujian
tingkat kesahihan dapat dilakukan secara per butir soal, yaitu dengan mengkorelasikan
skor-skor tiap butir tes dengan skor keseluruhan. Tes yang kesahihannya tinggi,
biasanya tinggi pula kesahihan butirbutirnya, walau mungkin terdapat beberapa
butir tes yang kurang sahih.
Ketepercayaan tes menunjuk
pada pengertian apakah suatu tes dapat mengukur secara konsisten sesuatu yang
akan diukur dari waktu ke waktu. Konsisten berarti (i) tes dapat memberikan
hasil yang relatif tetap terhadap sesuatu yang diukur, (ii) jawaban siswa
terhadap butir-butir tes relatif tetap, (iii) hasil tes diperiksa siapa pun
menghasilkan skor yang kurang lebih sama.
Hasil pengukuran tidak
hanya mencerminkan berapa banyak siswa berhasil dalam belajar, melainkan juga
bagaimana keakuratan tes itu sendiri. Keakuratan tes akan mempengaruhi skor
yang diperoleh siswa, maka skor itu tidak akan secara sempurna mencerminkan
kemampuan yang sebenarnya.
Prosedur pengujian
ketepercayaan tes adalah dengan melakukan tes ulang uji, teknik belah dua,
mempergunakan rumus Kuder Richardson 20 dan 21, koefisien alpha, dan
reliabilitas bentuk paralel.
Teknik ulang uji dilakukan
dengan memberikan tes dua kali dengan tes yang sama, dan hasilnya
dikorelasikan. Tinggi rendahnya koefisien korelasi menunjukkan tinggi
rendahnya tingkat ketepercayaan tes. Teknik ini mempunyai beberapa kelemahan,
misalnya sulit menghilangkan pengaruh jawaban pertama.
Pengujian dengan teknik
belah dua dilakukan dengan membagi tes ke dalam tes bernomor ganjil dan genap,
yang kemudian keduanya dikorelasikan. Koefisien korelasi yang diperoleh baru
menunjukkan reliabilitas separuh tes, maka kemudian dipergunakan rumus
Spearman-Brown untuk mencari reliabilitas keseluruhan tes.
Pengukuran dengan
mempergunakan rumus K - R 20 dan 21 dapat mengatasi kelemahan yang ada pada
teknik belah dua. Rumus K - R 20 akan memberikan indeks yang lebih besar
daripada K - R 21, tetapi penghitungannya lebih rumit. Penyusunan rumus K - R
21 lebih disarankan karena dapat mengukur secara lebih cermat. Koefisien alpha
dipakai untuk menguji reliabilitas tes (angket) yang jawabannya berskala.
Pengujian reliabilitas tes
dengan teknik bentuk paralel dilakukan dengan menyediakan dua perangkat tes
yang bersifat paralel atau ekuivalen. Setelah kedua perangkat tes itu
dicobakan, hasilnya dikorelasikan. Untuk meningkatkan keterpercayaan butir tes,
hendaknya dibuat butir-butir tes yang secukupnya. Butir tes yang semakin banyak
akan semakin mempertinggi tingkat ketepercayaan tes, walau setelah dalam
jumlah tertentu peningkatan itu kecil.
Peningkatan ketepercayaan
tes juga dilakukan dengan memilih butir-butir soal yang indeks tingkat
kesulitan dan daya bedanya memenuhi persyaratan. Untuk keperluan ini, kita
perlu melakukan analisis butir soal. Bahasa yang dipergunakan dalam tes harus
jelas, mudah dipahami, tidak bersifat ambigu, dan tidak membingungkan, agar tidak
menimbulkan kesalahpahaman.
Kondisi pelaksanaan tes
harus dikontrol sebaik-baiknya agar hal itu tidak mempengaruhi penampilan
siswa. Dalam memeriksa pekerjaan siswa, kita harus menghindari sifat
subjektivitas diri, terutama dalam tes esai. Oleh karena itu, sebelum memeriksa
pekerjaan siswa hendaknya membuat pedoman penilaian.
Analisis butir adalah
analisis hubungan antara skor-skor butir soal dengan skor keseluruhan,
membandingkan jawaban siswa terhadap suatu butir soal dengan jawaban terhadap
keseluruhan tes. Tujuan analisis adalah membuat tiap butir tes konsisten dengan
keseluruhan tes dan menilai efektivitas tes sebagai alat pengukuran.
Analisis butir dilakukan
untuk mencari indeks tingkat kesulitan, daya beda, dan efektivitas distraktor.
Butir soal yang baik adalah yang tidak terlalu sukar atau terlalu mudah yang
indeksnya berkisar antara 0,15 sampai dengan 0,85, yang mampu membedakan
antara siswa kelompok tinggi dan rendah yang indeks daya bedanya paling tidak
sebesar 0,25 serta semua distraktor yang disediakan dipilih.
Penghitungan indeks tingkat
kesulitan dan daya beda dapat dilakukan dengan mempergunakan tabel analisis
butir soal. Untuk maksud ini, kita harus mencapai proporsi jawaban betul kelompok
tinggi dan kelompok rendah, baru kemudian mengkonsultasikannya kepada tabel.
Butir soal yang indeks tingkat kesulitan dan daya bedanya tidak memenuhi
persyaratan disarankan untuk direvisi.
Distraktor seharusnya
dipilih oleh siswa kelompok rendah secara lebih banyak. Jika terjadi
sebaliknya, kelompok tinggi yang lebih banyak memilih, atau ada distraktor yang
tak dipilih, distraktor yang bersangkutan disarankan untuk direvisi. Tingkat
ketepercayaan tes esai dihitung dengan rumus alpha, sedang indeks tingkat
kesulitan serta indeks daya bedanya dicari dengan mempergunakan rumus yang
berbeda dengan tes objektif.
Sebuah tes yang baik di samping layak, sahih, dan tepercaya, juga harus memenuhi kriteria kepraktisan. Kriteria kepraktisan dapat dilihat dari segi keekonomisan, kemudahan pelaksanaan, penskoran, dan penafsiran.
Sebuah tes yang baik di samping layak, sahih, dan tepercaya, juga harus memenuhi kriteria kepraktisan. Kriteria kepraktisan dapat dilihat dari segi keekonomisan, kemudahan pelaksanaan, penskoran, dan penafsiran.