Persoalan alat ukur yang digunakan
evaluator ketika melakukan kegiatan evaluasi sering dihadapkan pada
persoalan akurasi, konsisten dan stabilitas sehingga hasil pengukuran
yang diperoleh bisa mengukur dengan akurat sesuatu yang sedang diukur.
Instrumen ini memang harus memiliki akurasi ketika digunakan. Konsisten
dan stabil dalam arti tidak mengalami perubahan dari waktu pengukuran
satu ke pengukuran yang lain.
Data yang kurang memiliki validitas dan
reliabilitas, akan menghasilkan kesimpulan yang bias, kurang sesuai
dengan yang seharusnya, dan bahkan bisa saja bertentangan dengan
kelaziman. Untuk membuat alat ukur instrumen itu, diperlukan kajian
teori, pendapat para ahli serta pengalaman-pengalaman yang kadangkala
diperlukan bila definisi operasional variabelnya tidak kita temukan
dalam teori. Alat ukur atau instrumen yang akan disusun itu tentu saja
harus memiliki validitas dan reliabilitas, agar data yang diperoleh dari
alat ukur itu bisa reliabel, valid dan disebut dengan validitas dan
reliabilitas alat ukur atau validitas dan reliabilitas instrumen.
1.1 Validitas Instrumen
1.1.1 Pengertian
Karakter pertama dan memiliki peranan
sangat penting dalam instrument evaluasi adalah valid. Suatu instrument
dikatakan valid, seperti yang duterangkan oleh Gay (1983) dan Johnson
& Johnson (2002), apabila instrument yang digunakan dapat mengukur
apa yang seharusnya diukur (Sukardi, 2008).
Pernyataan serupa juga disampaikan oleh Scarvia B. Anderson (dalam Arikunto, 1997) bahwa “A test is valid if it measures what is purpose to measure”.
Atau jika diartikan krang lebih, sebuah tes dikatakan valid apabila tes
tersebut mengukur apa yang hendak diukur. Dalam bahasa Indonesia
“Valid” disebut dengan istilah “Sahih”.
Menurut Sukardi (2008: 31) validitas
instrument suatu evaluasi, tidak lain adalah derajat yang menunjukkan
dimana suatu tes mengukur apa yang hendak diukur. Validitas suatu
instrument evaluasi mempunyai beberapa makna penting diantaranya seperti
berikut:
1) Validitas berhubungan dengan
ketepatan interpretasi hasil tes atau instrument evaluasi untuk group
individual dan bukan instrument itu sendiri.
2) Validitas diartikan sebagai derajat yang menunjukkan kategori yang bisa mencakup kategori rendah, menengah dan tinggi.
3) Prinsip suatu tes valid, tidak
universal. Validitas suatu tes yang perlu diperhatikan oleh para
peneliti adalah bahwa Ia hanya valid untuk suatu tujuan tertentu saja.
1.1.2 Macam-macam Validitas
Menurut Sukardi (2008) secara metodologis
validitas suatu tes dapat dibedakan menjadi empat macam, yaitu
validitas isi, validitas konstruk, validitas konkruen dan validitas
prediksi. Macam-macam validitas tersebut akan diuraikan sebagai berikut:
1) Validitas isi
Yang dimaksud validitas isi ialah derajat
dimana sebuah tes evaluasi mengukur cakupan substansi yang ingin
diukur. Untuk mendapatkan validitas isi memerlukan dua spek penting,
yaitu valid isi dan valid teknik sampling.Valid isi mencakup khususnya,
hal-hal yang berkaitan dengan apakah item-item evaluasi menggambarkan
pengukuran dalam cakupan yang ingin diukur. Sedangkan validitas teknik
sampling pada umunya berkaitan dengan bagaimanakah baiknya suatu sampel
tes mempresentasikan total cakupan isi (Sukardi, 2008).
Sedangkan Arikunto (1997: 64) sebuah tes
dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu
yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh
karena materi yang diberikan tertera dalam kurikulum maka validitas isi
juga disebut validitas kurikuler.
2) Validitas Konstruk
Validitas konstruk merupakan derajat yang menunjukkan suatu tes mengukur sebuah konstruk sementara atau Hyptotetical construct.
Secara definitife, konstruk merupakan suatu sifat yang tidak dapat
diobservasi, tetapi kita dapat merasakan pengaruhnya melalui salah satu
atau dua indera kita (Sukardi, 2008).
Sedangkan Arikunto(1997: 64) sebuah tes
dikatakan memiliki validitas konstruksi apabila butir-butir soal yang
membangun tes tersebut mengukur setiap aspek berfikir seperti disebutkan
dalam tujuan instruksional khusus. Dengan kata lain jika butir-butir
soal mengukur aspek berfikir tersebut sudah sesuai dengan aspek berfikir
yang menjadi tujuan instruksional.
3) Validitas Konkruen
Validitas konkruen adalah derajat dimana
skor dalam suatu tes dihubungkan dengan skor lain yang telah dibuat. Tes
dengan validitas konkruen biasanya diadministrasi dalam waktu yang sama
atau dengan criteria valid yang sudah ada. Sering kali juga terjadi
bahwa tes dibuat atau dikembangkan untuk pekerjaan yang sama seperti
beberapa tes lainnya, tetapi dengan cara yang lebih mudah dan lebih
cepat. Validitas konkruen ditentukan dengan membangun analisis hubungan
dan perbedaan (Sukardi, 2008).
4) Validitas Prediksi
Validitas prediksi adalah derajat yang
menunjukkan suatu tes dapat memprediksi tentang bagaimana baik seseorang
akan melakukan suatu prospek atau tugas atau pekerjaan yang
direncanakan. Validitas prediksi suatu tes pada umumnya ditentukan
dengan membangun hubungan antara skor tes dan beberapa ukuran
keberhasilan dalam situasi tertentu yang digunakan untuk memprediksi
keberhasilan, yang selanjutnya disebut sebagai predictor. Sedangkan
tingkah laku yang diprediksi disebut criterion (Sukardi, 2008).
Sedangkan menurut Arikunto(1997: 66)
memprediksi artinya meramal, dan meramal selalun mengenai hal yang akan
datang jika sekarang belum terjadi. Sebuah tes memiliki validitas
prediksi atau validitas ramalan apabila mempunyai kemampuan untuk
meramalkan apa yang akan terjadi pada masa yang akan datang.
1.1.3 Faktor-faktor yang Mempengaruhi Validitas
Banyak faktor yang dapat mempengaruhi
hasil tes evaluasi tidak valid. Beberapa faktor tersebut secara garis
besar dapat dibedakan menurut sumbernya, yaitu faktor internal dari tes,
faktor eksternal tes, dan faktor yang berasal dari siswa yang
bersangkutan.
1) Faktor yang berasal dari dalam tes
- Arahan tes yang disusun dengan makna tidak jelas sehingga dapat mengurangi validitas tes
- Kata-kata yang digunakan dalam struktur instrument evaluasi, tidak terlalu sulit
- Item tes dikonstruksi dengan jelas.
- Tingkat kesulitan item tes tidak tepat dengan materi pembelajaran yang diterima siswa.
- Waktu yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu kurang atau terlalu longgar.
- Jumlah item terlalu sedikit sehingga tidak mewakili sampel
- Jawaban masing-masing item evaluasi bisa diprediksi siswa
2) Faktor yang berasal dari administrasi dan skor tes.
- Waktu pengerjaan tidak cukup sehingga siswa dalam memberikan jawaban dalam situasi tergesa-gesa.
- Adanya kecrangan dalam tes sehingga tidak membedakan antara siswa yang belajar dengan melakukan kecurangan.
- Pemberian petunjuk dari dari pengawas yang tidak dapat dilakukan pada semua siswa.
- Teknik pemberian skor yang tidak konsisten.
- Siswa tidak dapat memngikuti arahan yang diberikan dalam tes baku.
- Adanya joki (orang lain bukan siswa) yang masuk dalam menjawab item tes yang diberikan.
3) Faktor yang berasal dari jawaban siswa
Seringkali terjadi bahwa interpretasi
terhadap item-item tes evaluasi tidak valid, karena dipengaruhi oleh
jawaban siswa dari pada interpretasi item-item pada tes evaluasi
(Sukardi, 2008).
1.1.4 Cara Mengetahui Validitas Alat Ukur
Sebuah tes dikatakan memiliki validitas
jika hasilnya sesuai dengan kriterium, dalam arti memilki kesejajaran
antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk
mengetahui kesejajaran adalah dengan teknik korelasi product moment yang
dikemukakan oleh pearson (Arikunto, 1997)
1.2 Reliabelitas Instrumen
1.2.1 Pengertian
Menurut Sukardi (2008: 43) relaibelitas
adalah karakter lain dari evaluasi. Reliabelitas juga dapat diartikan
sama dengan konsistensi atau keajegan. Suatu instrument evaluasi
dikatakan mempunyai nilai reliabelitas tinggi, apabila tes yang dibuat
mempunyai hasil konsisten dalam mengukur yang hendak diukur.
Sehubungan dengan reliabelitas ini
Scarvia B. Anderson dan kawan-kawan (dalam Arikunto, 1997) menyatakan
bahwa persyaratan bagi tes, yaitu validitas dan reliabelitas ini
penting. Dalam hal ini validitas lebih penting, dan reliabelitas ini
perlu, karena menyokong terbentuknya validitas. Sebuah tes mungkin
reliable tapi tidak valid. Sebaliknya tes yang valid biasanya reliable.
1.2.2 Tipe-tipe Reliabelitas
Menurut Sukardi (2008) Ada beberapa tipe
reliabelitas yang digunakan dalam kegiatan evaluasi dan masing-masing
reliebelitas mempunyai konsistensi yang berbeda-beda. Beberap tipe
reliebelitas di antaranya: tes-retes, ekivalen, dan belah dua yang
ditentukan melalui korelasi.
Berbagai tipe tersebut akan diuraikan sebagai berikut:
1) Relibalelitas Dengan Tes-Retes
Reliabelitas tes-retes tidak lain adalah
derajat yang menunjukkan konsistensi hasil sebuah tes dari waktu ke
waktu. Tes-Retes menunjukkan variasi skor yang diperoleh dari
penyelenggaraan satu tes evaluasi yang dilaksanakan dua kali atau lebih,
sebagai akibat kesalahan pengukuran. Dengan kata lain, kita tertarik
dalam mencari kejelasan bahwa skor siswa mencapai suatu tes pada waktu
tertentu adalah sama hasilnya, ketika siswa itu dites lagi dengan tes
yang sama. Dengan melakukan tes-retes tersebut. Seorang guru akan
mengetahui seberapa jauh konsistensi suatu tes mengukur apa yang ingin
diukur (Sukardi, 2008).
Sedangkan Arikunto (1997: 88) Metode tes
ulang (tes-retes) dilakukan untuk menghindari dua penyusunan dua seri
tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki
satu seri tes tapi dicobakan dua kali. Oleh karena tesnya satu dan
dicobakan dua kali, maka metode ini dapat disebut juga dengan single-test-double-trial-method.
Reliebelitas tes retes dapat dilakukan dengan cara seperti berikut:
- Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana.
- Setelah selang waktu tertentu, misalnya satu minggu atau dua minggu, lakukan kembali tes yang sama dengan kelompok yang sama tersebut.
- Korelasikan kedua hasil tes tersebut.
Jika hasil koefisien menunjukkan tinggi,
berarti reliabilias tes adalah bagus. Sebaliknya, jika korelasi rendah,
berarti tes tersebut mempunyai konsistensi rendah (Sukardi, 2008).
2) Reliabelitas Dengan Bentuk Ekivalensi
Sesuai dengan namanya yaitu ekivalen,
maka tes evaluasi yang hendak diukur reliabelitasnya dibuat identik
dengan tes acuan. Setiap tampilannya, kecuali substansi item yang ada,
dapat berbeda. Kedua tes tersebut sebaliknya mempunyai karate yang sama.
Karakteristik yang dimaksud misalnya mengukur variabel yang sama,
mempunyai jumlah item sama, struktur sama, mempunyai tingkat kesulitan
dan mempunyai petunjuk, cara penskoran, dan interpretasi yang sama
(Sukardi 2008).
Pernyataan serupa juga disampaikan oleh
Arikunto (1997: 87) tes paralel atau equivalent adalah dua buah tes yang
mempunyai kesamaan tujuan, tingkat kesukaran dan susunan, tetapi
butir-butirnya berbeda. Dalam istilah bahasa Inggris disebut Alternate-forms method (parallel forms).
Tes reliabelitas secara ekivalen dapat dilaksanakan dengan mengikuti langkah-langkah sebagai berikut:
- Tentukan sasaran yang hendak dites
- Lakukan tes yang dimaksud kepada subjek sasaran tersebut.
- Administrasinya hasilnya secara baik.
- Dalam waktu yang tidak terlalu lama, lakukan pengetesan yang kedua kalinya pada kelompok tersebut
- Korelasikan kedua hasil skor tersebut (Sukardi, 2008).
Perlu diketahui juga bahwa tes ekivalensi
mempunyai kelemahan yaitu bahwa membuat dua buah tes yang secara
esensial ekivalen adalah sulit. Akibatnya akan selalu terjadi kesalahan
pengukuran (Sukardi, 2008). Pernyataan lain juga disampaikan oleh
Arikunto (1997: 88) kelemahan dari metode ini adalah pengetes
pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula harus
tersedia waktu yang lama untuk mencobakan dua kali tes.
3) Reliebilitas Dengan Bentuk Belah Dua
Menurut Sukardi (2008: 47) Reliabilitas
belah dua ini termasuk reliabilitas yang mengukur konsistensi internal.
Yang dimaksud konsistensi internal adalah salah satu tipe reliabilitas
yang didasarkan pada keajegan dalam setiap item tes evaluasi.
Relibilitas belah dua ini pelaksanaanya hanya satu kali.
Cara melakukan reliabilitas belah dua pada dasarnya dapat dilakukan dengan urutan sebagai berikut:
- Lakukan pengetesan item-item yang telah dibuat kepada subjek sasaran.
- Bagi tes yang ada menjadi dua atas dasar dua item, yang paling umum dengan membagi item dengan nomor ganjil dengan item dengan nomor genap pada kelompok tersebut.
- Hitung skor subjek pada kedua belah kelompok penerima item genap dan item ganjil.
- Korelasikan kedua skor tersebut, menggunakan formula korelasi yang relevan dengan teknik pengukuran (Sukardi, 2008).
Untuk mengetahui seluruh tes harus digunakan rumus Spearman-Brown (Arikunto, 1997):
1.2.3 Faktor-Faktor Yang Mempengaruhi Reliabilitas Instrumen
Menurut Sukardi (2008:51-52) koefisien
reliabilitas dapat dipengaruhi oleh waktu penyelenggaraan tes-retes.
Interval penyelenggaraan yang terlalu dekat atau terlalu jauh, akan
mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga
mempengaruhi reliabilitas instrument evaluasi di antaranya sebagai
berikut::
1) Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item materi pembelajaran diukur.
2) Penyebaran skor, koefisien
reliabelitas secara langsung dipengaruhi oleh bentuk sebaran skor dalam
kelompok siswa yang di ukur. Semakin tinggi sebaran, semakin tinggi
estimasi koefisien reliable.
3) Kesulitan tes, tes normative yang
terlalu mudah atau terlalu sulit untuk siswa, cenderung menghasilkan
skor reliabilitas rendah.
4) Objektifitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan kompetensi sama, mencapai hasil yang sama.
0 komentar:
Posting Komentar