Latest Post

Pembuatan Kisi-Kisi

Written By Rahmad on Rabu, 10 Juli 2013 | 23.41



Tes evaluasi merupakan salah satu komponen yang sangat penting untuk mengetahui tingkat pemahaman dan kemampuan siswa untuk menguasai konsep, maupun proses pembelajaran yang telah dipelajarinya. Agar suatu tes evaluasi dapat berhasil memantau perkembangan anak didik maka tes tersebut harus memiliki validitas dari segi kurikulum yang meliputi SK-KD yang harus dikuasai siswa yang telah dilaksanakan selama proses pembelajaran.
Untuk mengetahui bahwa tes evaluasi yang dibuat benar- benar mampu mengukur kecakapan siswa, maka dalam pembuatan tes harus dibuat dulu desain tes evaluasi yaitu pembuatan kisi-kisi soal yang telah terencana. Kisi-kisi soal dibuat bukan untuk mempersulit guru dalam pembuatan soal itu sendiri, tapi dengan membuat kisi-kisi soal yang sudah terencana yang sesuai dengan SK, KD, Materi, dan Indikator pencapaian maka dalam pembuatan soal akan sangat mudah, dan tentujuga akan sangat membantu dalam penyebaran soal dan bahkan semua aspek dapat diukur dengan baik dan dengan akurat.

A.    Pengertian Kisi-kisi
Kisi-kisi adalah suatu format atau matriks yang memuat kriteria tentang soal-soal yang diperlukan atau yang hendak disusun. Kisi-kisi juga dapat diartikan test blue-print atau table of specification merupakan deskripsi kompetensi dan materi yang akan diujikan. Wujudnya adalah sebuah tabel yang memuat tentang perperincian materi dan tingkah laku beserta imbangan/proporsi yang dikehendaki oleh penilai. Tiap kotak diisi dengan bilangan yang menunjukkan jumlah soal (Suhasimi, 2007:185). Tujuan penyusunan kisi-kisi adalah untuk menentukan ruang lingkup dan sebagai petunjuk dalam menulis soal.

B.    Fungsi Kisi-kisi
1.       Panduan/pedoman dalam penulisan soal  yang hendak disusun
Pedoman penulisan soal meurupakan aspek tepenting ketika guru hendak memberikan soal kepada siswa, pedoman tersebut akan menjadi acuan bagi guru dalam penulisan soal sehingga akan memudahkan dalam pembuatan soal.
2.       Penulis soal akan menghasilkan soal-soal yang sesuai dengan tujuan tes.
Tes merupakan bahan evaluasi guru terhadap keberhasilan peserta didik dalam pembelajaran yang disampaikan, guru dalam mengevalusi peserta didik akan memberikan soal tes evaluasi yang bermacam-macam sesuai dengan tujuan pencapaian evalusi terhadap pembelajaran tertenu. Dalam pembuatan soal yang menggunakan kisi-kisi, penulis akan menghasilkan soal-soal yang sesuai dengan tujuan tes.
3.       Penulis soal yang berbeda akan menghasilkan perangkat soal yang relatif sama, dari segi tingkat kedalamannyas segi cakupan materi yang ditanyakan.
Penulisan kisi-kisi berfungsi untuk menselaraskan perangkat soal, sehingga hal ini juga akan mempermudah dalam proses evaluasi.

Kisi-kisi yang baik harus memenuhi persyaratan berikut ini :
a.       Kisi-kisi harus dapat mewakili isi silabus/kurikulum atau materi yang telah diajarkan  secara tepat dan proporsional.
b.       Komponen-komponennya diuraikan secara jelas dan mudah dipahami.
c.       Materi yang hendak ditanyakan dapat dibuatkan soalnya.

C.    Penulisan Kisi-kisi
Penulisan kisi-kis soal adalah kerangka dasar yang dipergunakan untuk penyusunan soal dalam evaluasi proses pendidikan dan pembelajaran. Dengan kisi-kisi soal ini, maka seorang guru dengan mudah dapat menyusun soal-soal evaluasi. Kisi-kisi soal inilah yang memberikan batasan guru dalam menyusun soal evaluasi.
Dengan kisi-kisi penulisan soal maka tidak akan terjadi penyimpangan tujuan dan sasaran dari penulisan soal untuk evaluasi penulisan soal. Guru hanya mengikuti arah dan isi yang diharapkan dalam kisi-kisi penulsan soal yang dimaksudkan.
Dalam penulisan kisi-kisi soal, guru harus memperhatikan hal-hal berikut:
1.       Nama sekolah
Nama sekolah ini menunjukkan tempat penyelenggaraan pendidikan dan pembelajaran yang akan dievaluasi proses pembelajarannya. Ini merupakan identitas sekolah.
2.       Satuan pendidikan
Satuan pendidikan menunjukkan tingkatan pendidikan yang menyelenggarakan proses pendidikan dan akan dievaluasi. Satuan pendidikan ini  misalnya SD, SMP, SMA/SMK.
3.       Mata Pelajaran
Mata pelajaran yang dimaksudkan dalam hal ini adalah mata pelajaran yang akan dibuatkan kisi-kisi soal dan dievaluasi hasil belajar anak-anak. Misalnya Matematika.
4.       Kelas/semester
Kelas/semester menunjukkan tingkatan yang akan dievaluasi, dengan menvantumkan kelas atau semsester ini, maka kita semakin tahu batasan materi yang akan kita jadikan soal evaluasi proses.
5.       Kurikulum acuan
Seperti yang kita ketahui model kurikulum di negeri ini selalu berganti, akhirnya ada tumpah tindih antara kurikulum yang digunakan dan kurikulum baru. Untuk hal tersebut maka kita informasikan kurikulum yang digunakan dalam penyusunan kisi-kisi penulisan soal. Misalny, KTSP.
6.       Alokasi waktu
Alokasi waktu ini ditulis sebagai penyediaan waktu untuk penyelesaian soal. Dengan alokasi ini, maka kita dapa memperkirakan kesulitan soal. Dan jumlah soal yang harus dibuat guru agar anak-anak tidak kehabisan waktu saat mengerjakan soal.
7.       Jumlah soal
Jumlah soal menunjukkan berapa banyak soal yang harus dibuat dan dikerjakan anak-anak sesuai dengan jatah alokasi waktu yang sudah dikerjakan untuk ujian bersangkutan. Dalam hal ini guru sudah memperkirakan penggunaan waktu untk masing-masing soal.
8.       Penulis/guru mata pelajaran
Ini menunjukkan identias guru mata pelajaran atau penulis kisi-kisi soal. Hal ini sangat penting untuk mengetahui tingkat kelayakan seseorang dalam penuisan kisi-kisi dan soalnya.
9.       Standar kompetensi
Standar kompetensi menunjukan kondis standar yang akan dicapai oleh peserta didik setelah mengikuti proses pendidikan dan pembelajaran. Dengan standar kompetensi ini maka guru dan anak didik dapat mempersiapakan segala yang harus dilakukan.
10.   Kompetensi dasar
Kompetensi dasar menunjukkan hal yang seharusnya dimiliki oleh anak didik setelah mengikuti proses pendidikan dan pembelajaran. Dalam penulisan kisi-kisi soal aspek ini kita munculkan untuk mengevaluasi tingkat pencapaiannya.
11.   Materi pelajaran
Ini menunjukkan semua materi yang  diberkan untuk proses pendidikan dan pembelajaran. Dalam penulisan kisi-kisi soal, aspek ini merupakan batasan isi dari materi pelajaran yang kita jadikan soal.
12.   Indikator soal
Indicator soal menunjukan perkiraan kondisi yang diambil dalam soal ujian. Indikasi yang bagaimana dari materi pelajaran yang diterapkan disekolah.



13.   Bentuk soal
Bentuk soal yang dimaksudkan adalah subjektif tes atau objektif tes. Untuk memudahkan kita dalam menyusun soal, maka kita harus menentukan bentuk yes dalam setiap materi pelajaran yang kita ujikan dalam proses evaluasi.
14.   Nomor soal
Nomor soal menunjukkan urutan soal untuk materi atau soal yang guru buat. Dal hal ini, setiap standar kompetensi dan kompetensi dasar, penulisan nomor soal dikisi-kisi penulisan soal tidak selalu berurutan.guru dapat menulis secara acak. Misalnya,  standar kompetensi A dan komptensi dasar A1 dapat saja diletakkan pada nomor 3 dan seterusnya sehingga tidak selalu standar kompetensi pertama dan kompetensir dasar pertama harus diurutkan di nomor satu.

VALIDITAS dan RELIABILITAS INSTRUMEN EVALUASI

Persoalan alat ukur yang digunakan evaluator ketika melakukan kegiatan evaluasi sering dihadapkan pada persoalan akurasi, konsisten dan stabilitas sehingga hasil pengukuran yang diperoleh bisa mengukur dengan akurat sesuatu yang sedang diukur. Instrumen ini memang harus memiliki akurasi ketika digunakan. Konsisten dan stabil dalam arti tidak mengalami perubahan dari waktu pengukuran satu ke pengukuran yang lain.
Data yang kurang memiliki validitas dan reliabilitas, akan menghasilkan kesimpulan yang bias, kurang sesuai dengan yang seharusnya, dan bahkan bisa saja bertentangan dengan kelaziman. Untuk membuat alat ukur instrumen itu, diperlukan kajian teori, pendapat para ahli serta pengalaman-pengalaman yang kadangkala diperlukan bila definisi operasional variabelnya tidak kita temukan dalam teori. Alat ukur atau instrumen yang akan disusun itu tentu saja harus memiliki validitas dan reliabilitas, agar data yang diperoleh dari alat ukur itu bisa reliabel, valid dan disebut dengan validitas dan reliabilitas alat ukur atau validitas dan reliabilitas instrumen.

1.1  Validitas Instrumen
1.1.1        Pengertian
Karakter pertama dan memiliki peranan sangat penting  dalam instrument evaluasi adalah valid. Suatu instrument dikatakan valid, seperti yang duterangkan oleh Gay (1983) dan Johnson & Johnson (2002), apabila instrument yang digunakan dapat mengukur apa yang seharusnya diukur (Sukardi, 2008).
Pernyataan serupa juga disampaikan oleh Scarvia B. Anderson (dalam Arikunto, 1997) bahwa “A test is valid if it measures what is purpose to measure”. Atau jika diartikan krang lebih, sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Dalam bahasa Indonesia “Valid” disebut dengan istilah “Sahih”.
Menurut Sukardi (2008: 31) validitas instrument suatu evaluasi, tidak lain adalah derajat yang menunjukkan dimana suatu tes mengukur apa yang hendak diukur. Validitas suatu instrument evaluasi mempunyai beberapa makna penting diantaranya seperti berikut:
1)      Validitas berhubungan dengan ketepatan interpretasi hasil tes atau instrument evaluasi untuk group individual dan bukan instrument itu sendiri.
2)      Validitas diartikan sebagai derajat yang menunjukkan kategori yang bisa mencakup kategori rendah, menengah dan tinggi.
3)      Prinsip suatu tes valid, tidak universal. Validitas suatu tes yang perlu diperhatikan oleh para peneliti adalah bahwa Ia hanya valid untuk suatu tujuan tertentu saja.
1.1.2        Macam-macam Validitas
Menurut Sukardi (2008) secara metodologis validitas suatu tes dapat dibedakan menjadi empat macam, yaitu validitas isi, validitas konstruk, validitas konkruen dan validitas prediksi. Macam-macam validitas tersebut akan diuraikan sebagai berikut:
1)      Validitas isi
Yang dimaksud validitas isi ialah derajat dimana sebuah tes evaluasi mengukur cakupan substansi yang ingin diukur. Untuk mendapatkan validitas isi memerlukan dua spek penting, yaitu valid isi dan valid teknik sampling.Valid isi mencakup khususnya, hal-hal yang berkaitan dengan apakah item-item evaluasi menggambarkan pengukuran dalam cakupan yang ingin diukur. Sedangkan validitas teknik sampling pada umunya berkaitan dengan bagaimanakah baiknya suatu sampel tes mempresentasikan total cakupan isi (Sukardi, 2008).
Sedangkan Arikunto (1997: 64) sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena materi yang diberikan tertera dalam kurikulum maka validitas isi juga disebut validitas kurikuler.
2)      Validitas Konstruk
Validitas konstruk merupakan derajat yang menunjukkan suatu tes mengukur sebuah konstruk sementara atau Hyptotetical construct. Secara definitife, konstruk merupakan suatu sifat yang tidak dapat diobservasi, tetapi kita dapat merasakan pengaruhnya melalui salah satu atau dua indera kita (Sukardi, 2008).
Sedangkan Arikunto(1997: 64) sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti disebutkan dalam tujuan instruksional khusus. Dengan kata lain jika butir-butir soal mengukur aspek berfikir tersebut sudah sesuai dengan aspek berfikir yang menjadi tujuan instruksional.
3)      Validitas Konkruen
Validitas konkruen adalah derajat dimana skor dalam suatu tes dihubungkan dengan skor lain yang telah dibuat. Tes dengan validitas konkruen biasanya diadministrasi dalam waktu yang sama atau dengan criteria valid yang sudah ada. Sering kali juga terjadi bahwa tes dibuat atau dikembangkan untuk pekerjaan yang sama seperti beberapa tes lainnya, tetapi dengan cara yang lebih mudah dan lebih cepat. Validitas konkruen ditentukan dengan membangun analisis hubungan dan perbedaan (Sukardi, 2008).
4)      Validitas Prediksi
Validitas prediksi adalah derajat yang menunjukkan suatu tes dapat memprediksi tentang bagaimana baik seseorang akan melakukan suatu prospek  atau tugas atau pekerjaan yang direncanakan. Validitas prediksi suatu tes pada umumnya ditentukan dengan membangun hubungan antara skor tes dan beberapa ukuran keberhasilan dalam situasi tertentu yang digunakan untuk memprediksi keberhasilan, yang selanjutnya disebut sebagai predictor. Sedangkan tingkah laku yang diprediksi disebut criterion (Sukardi, 2008).
Sedangkan menurut Arikunto(1997: 66) memprediksi artinya meramal, dan meramal selalun mengenai hal yang akan datang jika sekarang belum terjadi. Sebuah tes memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang.
1.1.3        Faktor-faktor yang Mempengaruhi Validitas
Banyak faktor yang dapat mempengaruhi hasil tes evaluasi tidak valid. Beberapa faktor tersebut secara garis besar dapat dibedakan menurut sumbernya, yaitu faktor internal dari tes, faktor eksternal tes, dan faktor yang berasal dari siswa yang bersangkutan.
1)      Faktor yang berasal dari dalam tes
  1. Arahan tes yang disusun dengan makna tidak jelas sehingga dapat mengurangi validitas tes
  2. Kata-kata yang digunakan dalam struktur instrument evaluasi, tidak terlalu sulit
  3. Item tes dikonstruksi dengan jelas.
  4. Tingkat kesulitan item tes tidak tepat dengan materi pembelajaran yang diterima siswa.
  5. Waktu yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu kurang atau terlalu longgar.
  6. Jumlah item terlalu sedikit sehingga tidak mewakili sampel
  7. Jawaban masing-masing item evaluasi bisa diprediksi siswa
2)      Faktor yang berasal dari administrasi dan skor tes.
  1. Waktu pengerjaan tidak cukup sehingga siswa dalam memberikan jawaban dalam situasi tergesa-gesa.
  2. Adanya kecrangan dalam tes sehingga tidak membedakan antara siswa yang belajar dengan melakukan kecurangan.
  3. Pemberian petunjuk dari dari pengawas yang tidak dapat dilakukan pada semua siswa.
  4. Teknik pemberian skor yang tidak konsisten.
  5. Siswa tidak dapat memngikuti arahan yang diberikan dalam tes baku.
  6. Adanya joki (orang lain bukan siswa) yang masuk dalam menjawab item tes yang diberikan.
3)      Faktor yang berasal dari jawaban siswa
Seringkali terjadi bahwa interpretasi terhadap item-item tes evaluasi tidak valid, karena dipengaruhi oleh jawaban siswa dari pada interpretasi item-item pada tes evaluasi (Sukardi, 2008).
1.1.4        Cara Mengetahui Validitas Alat Ukur
Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti memilki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah dengan teknik korelasi product moment yang dikemukakan oleh pearson (Arikunto, 1997)
1.2  Reliabelitas Instrumen
1.2.1        Pengertian
Menurut Sukardi (2008: 43) relaibelitas adalah karakter lain dari evaluasi. Reliabelitas juga dapat diartikan sama dengan konsistensi atau keajegan. Suatu instrument evaluasi dikatakan mempunyai nilai reliabelitas tinggi, apabila tes yang dibuat mempunyai hasil konsisten dalam mengukur yang hendak diukur.
Sehubungan dengan reliabelitas ini Scarvia B. Anderson dan kawan-kawan (dalam Arikunto, 1997) menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabelitas ini penting. Dalam hal ini validitas lebih penting, dan reliabelitas ini perlu, karena menyokong terbentuknya validitas. Sebuah tes mungkin reliable tapi tidak valid. Sebaliknya tes yang valid biasanya reliable.
1.2.2        Tipe-tipe Reliabelitas
Menurut Sukardi (2008) Ada beberapa tipe reliabelitas yang digunakan dalam kegiatan evaluasi dan masing-masing reliebelitas mempunyai konsistensi yang berbeda-beda. Beberap tipe reliebelitas di antaranya: tes-retes, ekivalen, dan belah dua yang ditentukan melalui korelasi.
Berbagai tipe tersebut akan diuraikan sebagai berikut:
1)      Relibalelitas Dengan Tes-Retes
Reliabelitas tes-retes tidak lain adalah derajat yang menunjukkan konsistensi hasil sebuah tes dari waktu ke waktu. Tes-Retes menunjukkan variasi skor yang diperoleh dari penyelenggaraan satu tes evaluasi yang dilaksanakan dua kali atau lebih, sebagai akibat kesalahan pengukuran. Dengan kata lain, kita tertarik dalam mencari kejelasan bahwa skor siswa mencapai suatu tes pada waktu tertentu adalah sama hasilnya, ketika siswa itu dites lagi dengan tes yang sama. Dengan melakukan tes-retes tersebut. Seorang guru akan mengetahui seberapa jauh konsistensi suatu tes mengukur apa yang ingin diukur (Sukardi, 2008).
Sedangkan Arikunto (1997: 88) Metode tes ulang (tes-retes) dilakukan untuk menghindari dua penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tapi dicobakan dua kali. Oleh karena tesnya satu dan dicobakan dua kali, maka metode ini dapat disebut juga dengan single-test-double-trial-method.
Reliebelitas tes retes dapat dilakukan dengan cara seperti berikut:
  1. Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana.
  2. Setelah selang waktu tertentu, misalnya satu minggu atau dua minggu, lakukan kembali tes yang sama dengan kelompok yang sama tersebut.
  3. Korelasikan kedua hasil tes tersebut.
Jika hasil koefisien menunjukkan tinggi, berarti reliabilias tes adalah bagus. Sebaliknya, jika korelasi rendah, berarti tes tersebut mempunyai konsistensi rendah (Sukardi, 2008).
2)      Reliabelitas Dengan Bentuk Ekivalensi
Sesuai dengan namanya yaitu ekivalen, maka tes evaluasi yang hendak diukur reliabelitasnya dibuat identik dengan tes acuan. Setiap tampilannya, kecuali substansi item yang ada, dapat berbeda. Kedua tes tersebut sebaliknya mempunyai karate yang sama. Karakteristik yang dimaksud misalnya mengukur variabel yang sama, mempunyai jumlah item sama, struktur sama, mempunyai tingkat kesulitan dan mempunyai petunjuk, cara penskoran, dan interpretasi yang sama (Sukardi 2008).
Pernyataan serupa juga disampaikan oleh Arikunto (1997: 87) tes paralel atau equivalent adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan susunan, tetapi butir-butirnya berbeda. Dalam istilah bahasa Inggris disebut Alternate-forms method (parallel forms).
Tes reliabelitas secara ekivalen dapat dilaksanakan dengan mengikuti langkah-langkah sebagai berikut:
  1. Tentukan sasaran yang hendak dites
  2. Lakukan tes yang dimaksud kepada subjek sasaran tersebut.
  3. Administrasinya hasilnya secara baik.
  4. Dalam waktu yang tidak terlalu lama, lakukan pengetesan yang kedua kalinya pada kelompok tersebut
  5. Korelasikan kedua hasil skor tersebut (Sukardi, 2008).
Perlu diketahui juga bahwa tes ekivalensi mempunyai kelemahan yaitu bahwa membuat dua buah tes yang secara esensial ekivalen adalah sulit. Akibatnya akan selalu terjadi kesalahan pengukuran (Sukardi, 2008). Pernyataan lain juga disampaikan oleh Arikunto (1997: 88) kelemahan dari metode ini adalah pengetes pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.
3)      Reliebilitas Dengan Bentuk Belah Dua
Menurut Sukardi (2008: 47) Reliabilitas belah dua ini termasuk reliabilitas yang mengukur konsistensi internal. Yang dimaksud konsistensi internal adalah salah satu tipe reliabilitas yang didasarkan pada keajegan dalam setiap item tes evaluasi. Relibilitas belah dua ini pelaksanaanya hanya satu kali.
Cara melakukan reliabilitas belah dua pada dasarnya dapat dilakukan dengan urutan sebagai  berikut:
  1. Lakukan pengetesan item-item yang telah dibuat kepada subjek sasaran.
  2. Bagi tes yang ada menjadi dua atas dasar dua item, yang paling umum dengan membagi item dengan nomor ganjil dengan item dengan nomor genap pada kelompok tersebut.
  3. Hitung skor subjek pada kedua belah kelompok penerima item genap dan item ganjil.
  4. Korelasikan kedua skor tersebut, menggunakan formula korelasi yang relevan dengan teknik pengukuran (Sukardi, 2008).
Untuk mengetahui seluruh tes harus digunakan rumus Spearman-Brown (Arikunto, 1997):
1.2.3        Faktor-Faktor Yang Mempengaruhi Reliabilitas Instrumen
Menurut Sukardi (2008:51-52) koefisien reliabilitas dapat dipengaruhi oleh waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga mempengaruhi reliabilitas instrument evaluasi di antaranya sebagai berikut::
1)      Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item materi pembelajaran diukur.
2)      Penyebaran skor, koefisien reliabelitas secara langsung dipengaruhi oleh bentuk sebaran skor dalam kelompok siswa yang di ukur. Semakin tinggi sebaran, semakin tinggi estimasi koefisien reliable.
3)      Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit untuk siswa, cenderung menghasilkan skor reliabilitas rendah.
4)      Objektifitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan kompetensi sama, mencapai hasil yang sama.

ANALSIS BUTIR (TINGKAT KESUKARAN DAN DAYA PEMBEDA)

A.  Teknik Analisis Soal Tes ( Item Analisis )
   Pada analisis butir, butir akan dilihat karakteristiknya  dan dipilih butir-butir yang baik. butir yang baik adalah butir-butir yang karakteristiknya  memenuhi syarat sebagaimana kriteria  karakteristik butir yang baik.[3]
  Adapun cara untuk memperbaiki proses belajar- mengajar yang paling efektif ialah dengan jalan mengevaluasi tes  hasil belajar yang diperoleh dari proses belajar- mengajar itu sendiri. Dengan kata lain, hasil tes itu di olah sedemikian rupa sehingga dari hasil pengolahan itu dapat diketahui komponen –komponen manakah dari proses – mengajar itu yang masih lemah.
Pengolahan tes hasil belajar dalam rangka memperoleh proses belajar mengajar dapat dilakukan dengan berbagai cara, antara lain:
     1.    Dengan membuat analisis soal ( item analysis )
     2.    Dengan menghitung validitas dan keandalan tes
     Dalam pasal ini khusus akan dibicarakan cara yang pertama yaitu teknik analisis soal atau item analisis.
Menurut Thorndike dan Hagen (1977), analisis terhadap soal-soal tes yang telah dijawab oleh murid- murid mempunyai dua tujuan penting.
     Pertama, jawaban- jawaban soal itu merupakan informasi diagnostik untuk meneliti pelajaran dari kelas itu dan kegagalan- kegagalan belajar, serta selanjutnya untuk membimbing ke arah cara yang lebih baik.
Kedua, jawaban- jawaban terhadap soal yang terpisah dan perbaikan ( review ) soal- soal yang didasarkan atas jawaban – jawaban itu merupakan basis bagi persiapan tes- tes yang lebih baik untuk tahun berikutnya.
Jadi tujuan khusus dari items analisis ialah mencari soal tes mana yang baik dan mana yang tidak baik, dengan membuat analisis soal, sedikitnya dapat mengetahui dari tiga segi  yang dapat diperoleh dari tiap soal, yaitu:
a.    Dari segi derajat kesukaran itemnya
b.    Dari segi daya pembeda itemnya
c.    Dari segi fungsi distraktornya.[4]
B.   Teknik Analisis Tingkat Kesukaran
     Suatu tes tidakk boleh terlalu mudah, dan juga tidak boleh terlalu sukar.  Sebuah item yang terlalu mudah  sehingga  dapat dijawab  dengan benar oleh semua siswa bukanlah merupakan item yang baik . begitu pula item yang terlalu sukar  sehingga tidak dapat dijawab oleh semua siswa juga bukan merupakan item yang baik. Jadi item yang baik adalah item yang mempunyai derajat kesukaran tertentu.[5]
     Menurut Witherington dalam bukunya berjudul psychological Education, mengatakan bahwa sudah atau belum memadainya derajat kesukaran item tes hasil belajar dapat diketahui dari besar kecilnya angka yang melambangkan tingkat kesulitan dari item tersebut. Angka yang dapat memberikan petunjuk mengenai  tingkat kesukaran item itu dikenal dengan istilah difficulty index ( angka index kesukaran item), yang dalam dunia evaluasi hasil belajar umumnya dilambangkan dengan  huruf P, yaitu singkatan dari kata proportion( proporsi =proposa). Dan  angka indek kesukaran item itu besarnya berkisar antara 0,00 sampai dengan 1,00. Artinya, angka indek kesukaran itu paling rendah adalah 0,00 dan paling tinggi adalah 1,00. Angka indek kesukaran sebesar 0,00 ( P= 0,00) merupakan petunjuk bagi tester bahwa butir item tersebut termasuk dalam katagori item yang terlalu sukar, sebab di sini seluruh testee tidak dapat menjawab item dengan betul ( yang dapat menjawab dengan betul =0). Sebaliknya, apabila angka indek kesukaran item itu adalah 1,00 ( P= 1,00) hal ini mengandung makna bahwa butir item yang bersangkutan adalah termasuk dalam katagori item yang terlalu mudah, sebab di sini seluruh testee dapat menjawab dengan betul butir item yang bersangkutan ( yang dapat menjawab dengan butir = 100%= 100= 1,00
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut:
·         Soal dengan P 0,00 sampai 0,30 adalah soal sukar
·         Soal dengan P 0,30 sampai 0,70 adalah soal sedang
·         Soal dengan P 0,70 sampai 1,00 adalah soal mudah

C.  Teknik Analisis Daya Pembeda Item
            Daya pembeda (item discriminination) adalah untuk menentukan dapat tidaknya  suatu soal membedakan kelompok dalam aspek yang diukur sesuai dengan perbedaan yang ada dalam kelomppok itu. Indeks yang digunakan dalam membedakan antara peserta tes yang berkemampuan tinggi dengan peserta tes yang berkemampuan rendah. Indeks ini menunjukkan  kesesuaian antara fungsi  soal dengan fungsi tes secara keseluruhan.[9]
Mengetahui daya pembeda item itu penting sekali, sebab salah satu dasar yang dipegang untuk menyusun butir-butir item tes hasil belajar adalah adanya anggapan, bahwa kemampuan antara siswa yang satu dengan siswa yang lain itu berbeda-beda, dan bahwa butir-butir tes hasil belajar itu haruslah mampu memberikan hasil tes yang mencerminkan adanya perbedaan-perbedaan kemampuan yang terdapat di kalangan siswa tersebut.[10]
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi, disingkat D. Seperti halnya indeks kesukaran, indeks diskriminasi (daya pembeda) ini berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks diskriminasi ada tanda negatif.[11]
Daya pembeda item itu dapat diketahui melalui atau dengan melihat besar kecilnya angka indeks diskriminasi item. Angka indeks diskriminasi item adalah sebuah angka yang menunjukkan besar kecilnya daya pembeda yang dimiliki oleh sebutir item. Daya pembeda pada dasarnya dihitung atas dasar pembagian siswa ke dalam dua kelompok, yaitu kelompok atas yakni kelompok yang tergolong pandai, dan kelompok bawah, yaitu kelompok siswa yang tergolong bodoh. Dalam hubungan ini, jika sebutir item memiliki angka indeks diskriminasi item dengan tanda positif, hal ini merupakanmpetunjuk bahwa butir item tersebut telah memiliki daya pembeda, dalam arti bahwa siswa yang termasuk kategori pandai lebih banyak yang dapat menjawab dengan betul terhadap butir item yang bersangkutan, sedangkan siswa yang termasuk kategori bodoh lebih banyak yang menjawab salah.
Jika sebutir item angka indeks diskriminasinya = 0,00 (nihil), maka hal ini menunjukkan bahwa butir item yang bersangkutan tidak memiliki daya pembeda sama sekali, dalam arti bahwa jumlah siswa kelompok atas yang jawabannya betul (atau salah) sama dengan jumlah siswa kelompok bawah yang jawabannya betul. Jadi diantara kedua kelompok siswa tersebut tidak ada perbedaannya sama sekali, atau perbedaannya sama dengan nol.
Adapun apabila angka indeks diskriminasi item dari sebutir item bertanda negatif, maka pengertian yang terkandung didalamnya adalah, bahwa butir item yang bersangkutan lebih banyak dijawab betul oleh siswa kelompok bawah ketimbang siswa kelompok atas.[12] Dengan demikian ada tiga titik pada daya pembeda yaitu:

Adapun klasifikasi daya pembeda adalah:
Besarnya angka indeks diskriminasi item (D)
Klasifikasi
interpretasi
Kurang dari 0,20
 Poor (jelek)
Butir item yang bersangkutan daya pembedanya lemah sekali, dianggap tidak memiliki daya pembeda yang baik
0,20 – 0.40
Satisfactory (cukup)
Butir item yang bersangkutan telah memiliki daya pembeda yang cukup (sedang)
0,40 – 0,70
Good (baik)
Butir item yang bersangkutan telah memiliki daya pembeda yang baik
0,70 – 1,00
Excellent (sangat baik)
Butir item yang bersangkutan telah memiliki daya pembeda yang baik sekali
Bertanda negatif
-
Butir item yang bersangkutan daya pembedanya negatif (jelek sekali)[16]
D.  Teknik Analisis Fungsi Distraktor
Pada saat membicarakan tentang objektif bentuk multiple choice item telah dikemukakan bahwa pada tes objektif bentuk multiple choice item tesebut untuk setiap butir item yang dikeluarkan dalam tes hasil belajar telah dilengkapi dengan beberapa kemungkinan jawab, atau yang sering dikenal dengan istilah option atau alternatif.
Option atau alternatif itu jumlahnya berkisar antara tiga sampai dengan lima buah, dan dari kemungkinan-kemungkinan jawab yang terpasang pada setiap butir item itu, salah satu diantaranya adalah merupakan jawaban betul, sedangkan sisanya adalah merupakan jawaban salah. Jawaban-jawaban salah itulah yang biasa dikenal dengan istilah distraktor (pengecoh).
Tujuan utama dari pemasangan distraktor pada setiap butir item itu adalah, agar dari sekian banyak testee yang mengikuti tes hasil belajar ada yang tertarik untuk memilihnya, sebab mereka menyangka bahwa distraktor yang mereka pilih itu merupakan jawaban betul. Jadi mereka terkecoh, menganggap bahwa distraktor yang terpasang pada item itu sebagai kunci jawaban item, padahal bukan. Semakin banyak testee yang terkecoh, maka dapat dinyatakan bahwa distraktor yang dipasang itu makin dapat menjalankan fungsinya dengan sebaik-baiknya. Sebaliknya, apabila distraktor yang dipasang pada setiap butir item itu “tidak laku”(maksudnya: tidak ada seoangpun dari sekian banyak testee yang merasa tertarik untuk memilih distraktor tersebut sebagai jawaban betul), maka hal ini mengandung makna bahwa distraktor tersebut tidak menjalankan fungsinya dengan baik. Dengan kata lain, distraktor baru dapat dikatakan telah dapat menjalankan fungsinya dengan baik, apabila distraktor tersebut telah memiliki daya tarik demikian rupa, sehingga para testee (khususnya yang termasuk kategori kemampuan rendah) merasa bimbang, dan ragu-ragu sehingga pada akhirnya mereka menjadi terkecoh untuk memilih distraktor sebagai jawaban betul, sebab mereka mengira bahwa yang mereka pilih itu kunci jawaban item, padahal bukan.
Menganalisis fungsi distraktor sering dikenal dengan istilah lain, yaitu: menganalisis pola penyebaran jawaban item. Adapun yang dimaksud pola penyebaran item ialah suatu pola yang dapat menggambarkan bagaimana testee menentukan pilihan jawabnya terhadap kemungkinan-kemungkinan jawab yang telah dipasangkan pada setiap butir item.
Suatu kemungkinan dapat terjadi, yaitu bahwa dari keseluruhan alternatif yang dipasang pada butir item tertentu, samasekali tidak dipilih oleh testee. Dengan kata lain, testee menyatakan “blangko”. Pernyataan blangko ini sering dikenal dengan istilah Oniet dfan biasa diberi lambang dengan huruf O.[17]
Sesuatu distraktor dapat diperlakukan dengan tiga cara:
a.       Diterima, karena sudah baik
b.      Ditolak, karena tidak baik
c.       Ditulis kembali, karena kurang baik
Kekurangannya mungkin hanya terletak pada rumusan kalimatnya sehingga hanya perlu ditulis kembali, dengan perubahan seperlunya. Menulis soal adalah suatu pekerjaan sulit, sehingga apabila masih dapat diperbaiki saja, tidak dibuang. Suatu distraktor dapat dikatakan berfungsi baik jika paling sedikit dipilih oleh 5% pengikut tes.[18]
Diberdayakan oleh Blogger.