VALIDITAS dan RELIABILITAS INSTRUMEN EVALUASI

Persoalan alat ukur yang digunakan evaluator ketika melakukan kegiatan evaluasi sering dihadapkan pada persoalan akurasi, konsisten dan stabilitas sehingga hasil pengukuran yang diperoleh bisa mengukur dengan akurat sesuatu yang sedang diukur. Instrumen ini memang harus memiliki akurasi ketika digunakan. Konsisten dan stabil dalam arti tidak mengalami perubahan dari waktu pengukuran satu ke pengukuran yang lain.

Data yang kurang memiliki validitas dan reliabilitas, akan menghasilkan kesimpulan yang bias, kurang sesuai dengan yang seharusnya, dan bahkan bisa saja bertentangan dengan kelaziman. Untuk membuat alat ukur instrumen itu, diperlukan kajian teori, pendapat para ahli serta pengalaman-pengalaman yang kadangkala diperlukan bila definisi operasional variabelnya tidak kita temukan dalam teori. Alat ukur atau instrumen yang akan disusun itu tentu saja harus memiliki validitas dan reliabilitas, agar data yang diperoleh dari alat ukur itu bisa reliabel, valid dan disebut dengan validitas dan reliabilitas alat ukur atau validitas dan reliabilitas instrumen.

1.1 Validitas Instrumen

1.1.1 Pengertian

Karakter pertama dan memiliki peranan sangat penting dalam instrument evaluasi adalah valid. Suatu instrument dikatakan valid, seperti yang duterangkan oleh Gay (1983) dan Johnson & Johnson (2002), apabila instrument yang digunakan dapat mengukur apa yang seharusnya diukur (Sukardi, 2008).

Pernyataan serupa juga disampaikan oleh Scarvia B. Anderson (dalam Arikunto, 1997) bahwa “A test is valid if it measures what is purpose to measure”. Atau jika diartikan krang lebih, sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Dalam bahasa Indonesia “Valid” disebut dengan istilah “Sahih”.

Menurut Sukardi (2008: 31) validitas instrument suatu evaluasi, tidak lain adalah derajat yang menunjukkan dimana suatu tes mengukur apa yang hendak diukur. Validitas suatu instrument evaluasi mempunyai beberapa makna penting diantaranya seperti berikut:

1) Validitas berhubungan dengan ketepatan interpretasi hasil tes atau instrument evaluasi untuk group individual dan bukan instrument itu sendiri.

2) Validitas diartikan sebagai derajat yang menunjukkan kategori yang bisa mencakup kategori rendah, menengah dan tinggi.

3) Prinsip suatu tes valid, tidak universal. Validitas suatu tes yang perlu diperhatikan oleh para peneliti adalah bahwa Ia hanya valid untuk suatu tujuan tertentu saja.

1.1.2 Macam-macam Validitas

Menurut Sukardi (2008) secara metodologis validitas suatu tes dapat dibedakan menjadi empat macam, yaitu validitas isi, validitas konstruk, validitas konkruen dan validitas prediksi. Macam-macam validitas tersebut akan diuraikan sebagai berikut:

1) Validitas isi

Yang dimaksud validitas isi ialah derajat dimana sebuah tes evaluasi mengukur cakupan substansi yang ingin diukur. Untuk mendapatkan validitas isi memerlukan dua spek penting, yaitu valid isi dan valid teknik sampling.Valid isi mencakup khususnya, hal-hal yang berkaitan dengan apakah item-item evaluasi menggambarkan pengukuran dalam cakupan yang ingin diukur. Sedangkan validitas teknik sampling pada umunya berkaitan dengan bagaimanakah baiknya suatu sampel tes mempresentasikan total cakupan isi (Sukardi, 2008).

Sedangkan Arikunto (1997: 64) sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena materi yang diberikan tertera dalam kurikulum maka validitas isi juga disebut validitas kurikuler.

2) Validitas Konstruk

Validitas konstruk merupakan derajat yang menunjukkan suatu tes mengukur sebuah konstruk sementara atau Hyptotetical construct. Secara definitife, konstruk merupakan suatu sifat yang tidak dapat diobservasi, tetapi kita dapat merasakan pengaruhnya melalui salah satu atau dua indera kita (Sukardi, 2008).

Sedangkan Arikunto(1997: 64) sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti disebutkan dalam tujuan instruksional khusus. Dengan kata lain jika butir-butir soal mengukur aspek berfikir tersebut sudah sesuai dengan aspek berfikir yang menjadi tujuan instruksional.

3) Validitas Konkruen

Validitas konkruen adalah derajat dimana skor dalam suatu tes dihubungkan dengan skor lain yang telah dibuat. Tes dengan validitas konkruen biasanya diadministrasi dalam waktu yang sama atau dengan criteria valid yang sudah ada. Sering kali juga terjadi bahwa tes dibuat atau dikembangkan untuk pekerjaan yang sama seperti beberapa tes lainnya, tetapi dengan cara yang lebih mudah dan lebih cepat. Validitas konkruen ditentukan dengan membangun analisis hubungan dan perbedaan (Sukardi, 2008).

4) Validitas Prediksi

Validitas prediksi adalah derajat yang menunjukkan suatu tes dapat memprediksi tentang bagaimana baik seseorang akan melakukan suatu prospek atau tugas atau pekerjaan yang direncanakan. Validitas prediksi suatu tes pada umumnya ditentukan dengan membangun hubungan antara skor tes dan beberapa ukuran keberhasilan dalam situasi tertentu yang digunakan untuk memprediksi keberhasilan, yang selanjutnya disebut sebagai predictor. Sedangkan tingkah laku yang diprediksi disebut criterion (Sukardi, 2008).

Sedangkan menurut Arikunto(1997: 66) memprediksi artinya meramal, dan meramal selalun mengenai hal yang akan datang jika sekarang belum terjadi. Sebuah tes memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang.

1.1.3 Faktor-faktor yang Mempengaruhi Validitas

Banyak faktor yang dapat mempengaruhi hasil tes evaluasi tidak valid. Beberapa faktor tersebut secara garis besar dapat dibedakan menurut sumbernya, yaitu faktor internal dari tes, faktor eksternal tes, dan faktor yang berasal dari siswa yang bersangkutan.

1) Faktor yang berasal dari dalam tes

Arahan tes yang disusun dengan makna tidak jelas sehingga dapat mengurangi validitas tes
Kata-kata yang digunakan dalam struktur instrument evaluasi, tidak terlalu sulit
Item tes dikonstruksi dengan jelas.
Tingkat kesulitan item tes tidak tepat dengan materi pembelajaran yang diterima siswa.
Waktu yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu kurang atau terlalu longgar.
Jumlah item terlalu sedikit sehingga tidak mewakili sampel
Jawaban masing-masing item evaluasi bisa diprediksi siswa

2) Faktor yang berasal dari administrasi dan skor tes.

Waktu pengerjaan tidak cukup sehingga siswa dalam memberikan jawaban dalam situasi tergesa-gesa.
Adanya kecrangan dalam tes sehingga tidak membedakan antara siswa yang belajar dengan melakukan kecurangan.
Pemberian petunjuk dari dari pengawas yang tidak dapat dilakukan pada semua siswa.
Teknik pemberian skor yang tidak konsisten.
Siswa tidak dapat memngikuti arahan yang diberikan dalam tes baku.
Adanya joki (orang lain bukan siswa) yang masuk dalam menjawab item tes yang diberikan.

3) Faktor yang berasal dari jawaban siswa

Seringkali terjadi bahwa interpretasi terhadap item-item tes evaluasi tidak valid, karena dipengaruhi oleh jawaban siswa dari pada interpretasi item-item pada tes evaluasi (Sukardi, 2008).

1.1.4 Cara Mengetahui Validitas Alat Ukur

Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti memilki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah dengan teknik korelasi product moment yang dikemukakan oleh pearson (Arikunto, 1997)

1.2 Reliabelitas Instrumen

1.2.1 Pengertian

Menurut Sukardi (2008: 43) relaibelitas adalah karakter lain dari evaluasi. Reliabelitas juga dapat diartikan sama dengan konsistensi atau keajegan. Suatu instrument evaluasi dikatakan mempunyai nilai reliabelitas tinggi, apabila tes yang dibuat mempunyai hasil konsisten dalam mengukur yang hendak diukur.

Sehubungan dengan reliabelitas ini Scarvia B. Anderson dan kawan-kawan (dalam Arikunto, 1997) menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabelitas ini penting. Dalam hal ini validitas lebih penting, dan reliabelitas ini perlu, karena menyokong terbentuknya validitas. Sebuah tes mungkin reliable tapi tidak valid. Sebaliknya tes yang valid biasanya reliable.

1.2.2 Tipe-tipe Reliabelitas

Menurut Sukardi (2008) Ada beberapa tipe reliabelitas yang digunakan dalam kegiatan evaluasi dan masing-masing reliebelitas mempunyai konsistensi yang berbeda-beda. Beberap tipe reliebelitas di antaranya: tes-retes, ekivalen, dan belah dua yang ditentukan melalui korelasi.

Berbagai tipe tersebut akan diuraikan sebagai berikut:

1) Relibalelitas Dengan Tes-Retes

Reliabelitas tes-retes tidak lain adalah derajat yang menunjukkan konsistensi hasil sebuah tes dari waktu ke waktu. Tes-Retes menunjukkan variasi skor yang diperoleh dari penyelenggaraan satu tes evaluasi yang dilaksanakan dua kali atau lebih, sebagai akibat kesalahan pengukuran. Dengan kata lain, kita tertarik dalam mencari kejelasan bahwa skor siswa mencapai suatu tes pada waktu tertentu adalah sama hasilnya, ketika siswa itu dites lagi dengan tes yang sama. Dengan melakukan tes-retes tersebut. Seorang guru akan mengetahui seberapa jauh konsistensi suatu tes mengukur apa yang ingin diukur (Sukardi, 2008).

Sedangkan Arikunto (1997: 88) Metode tes ulang (tes-retes) dilakukan untuk menghindari dua penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tapi dicobakan dua kali. Oleh karena tesnya satu dan dicobakan dua kali, maka metode ini dapat disebut juga dengan single-test-double-trial-method.

Reliebelitas tes retes dapat dilakukan dengan cara seperti berikut:

Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana.
Setelah selang waktu tertentu, misalnya satu minggu atau dua minggu, lakukan kembali tes yang sama dengan kelompok yang sama tersebut.
Korelasikan kedua hasil tes tersebut.

Jika hasil koefisien menunjukkan tinggi, berarti reliabilias tes adalah bagus. Sebaliknya, jika korelasi rendah, berarti tes tersebut mempunyai konsistensi rendah (Sukardi, 2008).

2) Reliabelitas Dengan Bentuk Ekivalensi

Sesuai dengan namanya yaitu ekivalen, maka tes evaluasi yang hendak diukur reliabelitasnya dibuat identik dengan tes acuan. Setiap tampilannya, kecuali substansi item yang ada, dapat berbeda. Kedua tes tersebut sebaliknya mempunyai karate yang sama. Karakteristik yang dimaksud misalnya mengukur variabel yang sama, mempunyai jumlah item sama, struktur sama, mempunyai tingkat kesulitan dan mempunyai petunjuk, cara penskoran, dan interpretasi yang sama (Sukardi 2008).

Pernyataan serupa juga disampaikan oleh Arikunto (1997: 87) tes paralel atau equivalent adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan susunan, tetapi butir-butirnya berbeda. Dalam istilah bahasa Inggris disebut Alternate-forms method (parallel forms).

Tes reliabelitas secara ekivalen dapat dilaksanakan dengan mengikuti langkah-langkah sebagai berikut:

Tentukan sasaran yang hendak dites
Lakukan tes yang dimaksud kepada subjek sasaran tersebut.
Administrasinya hasilnya secara baik.
Dalam waktu yang tidak terlalu lama, lakukan pengetesan yang kedua kalinya pada kelompok tersebut
Korelasikan kedua hasil skor tersebut (Sukardi, 2008).

Perlu diketahui juga bahwa tes ekivalensi mempunyai kelemahan yaitu bahwa membuat dua buah tes yang secara esensial ekivalen adalah sulit. Akibatnya akan selalu terjadi kesalahan pengukuran (Sukardi, 2008). Pernyataan lain juga disampaikan oleh Arikunto (1997: 88) kelemahan dari metode ini adalah pengetes pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.

3) Reliebilitas Dengan Bentuk Belah Dua

Menurut Sukardi (2008: 47) Reliabilitas belah dua ini termasuk reliabilitas yang mengukur konsistensi internal. Yang dimaksud konsistensi internal adalah salah satu tipe reliabilitas yang didasarkan pada keajegan dalam setiap item tes evaluasi. Relibilitas belah dua ini pelaksanaanya hanya satu kali.

Cara melakukan reliabilitas belah dua pada dasarnya dapat dilakukan dengan urutan sebagai berikut:

Lakukan pengetesan item-item yang telah dibuat kepada subjek sasaran.
Bagi tes yang ada menjadi dua atas dasar dua item, yang paling umum dengan membagi item dengan nomor ganjil dengan item dengan nomor genap pada kelompok tersebut.
Hitung skor subjek pada kedua belah kelompok penerima item genap dan item ganjil.
Korelasikan kedua skor tersebut, menggunakan formula korelasi yang relevan dengan teknik pengukuran (Sukardi, 2008).

Untuk mengetahui seluruh tes harus digunakan rumus Spearman-Brown (Arikunto, 1997):

1.2.3 Faktor-Faktor Yang Mempengaruhi Reliabilitas Instrumen

Menurut Sukardi (2008:51-52) koefisien reliabilitas dapat dipengaruhi oleh waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga mempengaruhi reliabilitas instrument evaluasi di antaranya sebagai berikut::

1) Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item materi pembelajaran diukur.

2) Penyebaran skor, koefisien reliabelitas secara langsung dipengaruhi oleh bentuk sebaran skor dalam kelompok siswa yang di ukur. Semakin tinggi sebaran, semakin tinggi estimasi koefisien reliable.

3) Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit untuk siswa, cenderung menghasilkan skor reliabilitas rendah.

4) Objektifitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan kompetensi sama, mencapai hasil yang sama.

Blog buat iseng-iseng aja :D

VALIDITAS dan RELIABILITAS INSTRUMEN EVALUASI

Written By Rahmad on Rabu, 10 Juli 2013 | 23.24

0 komentar:

Test Footer 2

Entri Populer

Pages

Mengenai Saya

Archives

Random Post

Popular Post

Trending Topic