ANALISIS ITEM UNTUK MENGUJI KUALITAS TES
Pendahuluan
Salah satu tugas yang penting sering dilupakan oleh staf
pengajar baik itu guru maupun dosen adalah melakukan sebuah evaluasi terhadap
alat ukur yang telah digunakan untuk mengukur keberhasilan belajar dari peserta
didiknya. Salah satu alat ukur tersebut adalah tes hasil belajar.
Banyak terlihat dalam kenyataan jika hasil tes menunjukkan
nilai di bawah rata-rata maka kesalahan itu dilimpahkan pada pesereta didik
atau testee (yang mengerjakan tes), sehingga menganggap bahwa dalam kumpulan
testee yang diberikan tes tersbut terdiri dari anak-anak yang bodoh. Pernyataan
seperti itu kemungkinan bisa benar namun bisa juga salah.
Begitu juga sebaliknya, jika asil dari tes menunjukkan nilai
di atas rata-rata, maka ada pemikiran bahwa siswa memahami materi dengan baik.
Dan guru atau tester akan beranggapan bahwa anak-anak yang diberikan tes
tersebut terdiri dari anak-anak yang pintar. Pandangan atau pendapat seperti
itu juga kemungkinan benar dan tidak memungkinkan juga salah.
Untuk mengatasi hal tersebut hendaknya pandangan yang tidak
bersifat global tersebut ditangkas dengan pandangan seorang tester atau staf
pengajar yang mampu memiliki pemikiran yang global. Artinya penyebab suatu
permasalahan tersebut dikaji lebih baik lagi, sehingga suatu permasalahan
tersebut bisa diketahui secara pasti apa penyebabnya.
Anggapan atau pandangan yang diungkapkan di atas merupakan
pandangan atau anggapan yang tidak bisa dibuktikan kebenarannya. Pamdangan
tersebut masih memiliki kerancuan dalam pembuktiannya. Untuk megatasi hal
tersebut tentunya kita harus memikirkan beberapa factor.
Salah satu factor penyebab dari hasil tes yang bagus maupun
yang tidak bagus adalahtes yang diberikan tersebut. Tes yang merupakan alat
ukur keberhasilan siswa dalam pembelajaran juga memiliki peran penting. Apabila
tes tersebut tidak tepat sasaran, tidak sesuai dengan kriteria tes yang baik
atau yang sesuai, maka secara otomatis hasil yang diterima juga tidak sesuai.
Maka dari itu dalam memberikan sebuah tes jua harus dipertimbangkan kriteria
tes yang sesuai untuk testee.
Untuk mengetahui tes tersebut termasuk ke dalam kategori tes
yang bagus atau tidak, kita bisa melakukan sebuah pengujian yang disebut dengan
analisis item. Analisis item ini dilakukan dengan melakukan penelusuran dan
pelacakan degan cermat terhadap butir-butir soal atau item yang merupaka bagian
yang tidak terpisahkan dari yang namanya tes hasil belajar sebagai totalitas. Penelusuran atau pelacakan itu dilakukan oleh tester dengan tujuan mengetahui,
apakah butir-butir item yang membangun tes hasil belajar itu sudah dapat
menjalankan fungsinya sebagai alat pengukur hasil belajar yang memadai atau
belum. Identifikasi terhadap setiap butir item tes hasil belajar itu dilakukan
dengan harapan akan menghasilkan berbagai informasi berharga, yang pada
dasarnya akan merupakan umpan balik guna melakukan perbaikan, pembenahan dan
penyempurnaan kembali terhadap butir-butr item yang telah dikeluarkan dalam tes
hasil belajar, sehingga pada masa-masa yang akan datang tes hasil belajar
disusun dan dirancang oleh tester benar-benar dapat menjalankan fungsinya
sebagai alat pengukur tes hasil belajar yang berkualitas tinggi.
Permasalahnya bagaimana kita bisa melakukan analisis terhadap
item-item yang terdapat dalam tes hasil belajar. Dari segi apa kita bisa
melakukan analisis item tersebut. Dan apa tindak lanjut terhadap item yang
sudah dilakukan pengecekan kualitas item tersebut. Untuk bisa mengatasi semua
permasalahan tersebut, maka selanjutnya akan dibahas mengenai teknik
penganalisisan tes hasil belajar.
PEMBAHASAN
Penganilisisan terhadap item butir-butir tes hasil belajar
dapat dilakukan dari tiga segi, yang pertama dari segi derajat kesukaran, yang
kedua dari segi daya pembeda itemnya dan yang terakhir dari segi fungsi
distraktornya.
1.
Teknik analisis derajat
kesukaran
Bermutu atau tidaknya butir-butir item tes hasil belajar
pertama-tama dapt diketahui dari derajat kesukaran atau taraf kesulitan yang
dimiliki oleh masing-masing butir item tersebut. Butir-butir item tes hasil
belajar dapat dinyatakan sebagai butir-butir item yang baik, apabila
butir-butir item tersebut tidak terlalu sukar dan tidak pula terlalu mudah.
Dengan kata lain derajat kesukaran item tersebut adalah sedang atau cukup.
Bertitik tolak dari pernyataan tersebut, maka butir-butir
item tes hasil belajar dimana seluruh testee tidak dapat menjawab dengan betul
(karena terlalu sukar) tidak dapat disebut sebagai item yang baik. Demikian
juga sebaliknya, butir-butir item tes hasil belajar dimana seluruh testee dapat
menjawab dengan betul (karena terlalu mudah) juga tidak dapat digongkan kedalam
kategori item yang baik.
Cara apa yang digunakan untuk mengetahui butir-butir item tes
hasil belajar tertentu yang dapat dikatakan sudah memiliki derajat kesukaran
yang memadai? Witheringthon dalam bukunya yang berjudul Psychological Education, mengatakan bahwa, sudah atau belum
memadainya derajat kesukaran item tes hasil belajar dapat diketahui dari besar
kecilnya angka yang melambangkan tingkat kesulitan dari item tersebut. Angka
yang dapat memberikan petunjuk mengenai tingkat kesulitan item tersebut dikenal
dengan istilah difficulty index (angka
indeks kesukaran item), yang dalam dunia evaluasi hasil belajar umumnya
dilambangkan dengan huruf P yang merupakan singkatan dari proporsi.
Menurut Whiterington, angka indeks kesukaran item tersebut
besarnya berkisar antara 0,00 sampai dengan 0,01. Artinya angka indeks
kesukaran paling rendah adalah 0,00 dan paling tinggi adalah 1,00. Angka indeks
0,00 merupakan petunjuk bagi tester bahwa item butir-butir tes hasil belajar
tersebut terlalu sukar. Sebaliknya, jika angka indeks 0,01 merupakan bahwa
butir item yang bersangkutan terlalu mudah.
Untuk
memperoleh angka indeks tersebut menggunakan rumus :
Dimana
:
P
= proporsi atau angka indeks kesukaran (P kotor)
Np
= jumlah testee yang menjawab benar
N
= jumlah testee
Setelah
berhasil diidentifikasi butir-butir item mana yang derajat kesukarannya
termasuk dalam kategori cukup, terlalu sukar dan terlalu mudah maka yang
menjadi pokok permasalahan sekarang adalah, bagaimana menindaklanjuti hasil
analisis item tersebut?
Dalam
kaitannya dengan hasil analisis item dari segi derajat kesukaran, maka tindak
lanjut yang perlu dilakukan oleh tester adalah sebagai berikut.
Pertama, untuk butir-butir item yang
berdasarkan hasil analisis termasuk dalam kategori baik, seyogyanya butir item
tersebut segera dicata dalam buku bank soal. Selanjutnya butir-butir soal
tersebut dapat dikeluarkan lagi dalam tes-tes hasil belajar pada waktu-waktu
yang akan datang.
Kedua, untuk butir-butir item yang termasuk
dalam kategori terlalu sukar, ada tiga kemungkinan tidak lanjut, yaitu : (1)
Butim item tersebut dibuang atau didrop dan tidak akan dikeluarkan lagi dalam
tes-tes hasil belajar yang akan datang. (2) diteliti ulang, dilacak dan
ditelusuri sehingga dapat diketahui factor yang menyebabkan butir item yang
bersangkutan sulit dijawab oleh testee; apakah kalimat soalnya kurang jelas,
apakah petunjuk petunjuk cara mengerjakan atau menjawab soalnya sulit dipahami,
atau dalam soal terdapat istilah-istilah yang tidak jelas. Setelah dilakukan
perbaikan kembali, butir-butir item tersebut dikeluarkan lagi dalam tes hasil
belajar yang akan datang. (3) haruslah dipahami bahwa tidak setiap butir item
yang termasuk dalam kategori terlalu sukar itu sama sekali tidak memiliki
kegunaan. Butir-butir item yang terlalu sukar itu sewaktu-waktu masih dapat
diambil manfaatnya, yaitu dapat digunakan dalam tes-tes (terutama tes seleksi)
yang sifatnya sangat ketat. Dalam kondisi seperti itu sangat tepat apabila
butir-butir item yang dikeluarkan adalah butir-butir item yang termasuk
kategori terlalu sukar dengan asumsi bahwa testee dengan kemampuan yang rendah
dengan mudah akan tersisihkan dari seleksi, sedangkan testee yang memiliki
kemampuan tinggi tidak akan terlalu sukar untuk lolos dalam seleksi tersebut.
Ketiga, untuk butir-butir item yang termasuk
dalam kategori terlalu mudah, juga ada tiga kemungkinan tindak lanjut, yaitu:
(1) butir item tersebut dibuang atau didrop dan tidak akan dikeluarkan lagi
dalam tes-tes hasil belajar yang akan datang. (2) diteliti ulang, dilacak dan
ditelusuri secara cermat guna mengetahui factor yang menyebabkan butir item
tersebut dapat dijawab betul oleh hamper seluruh testee; ada kemungkinan option
atau alternative yang dipasangkan pada butir-butir item yang bersangkutan
terlalu mudah diketahui oleh testee, mana item yang merupakan kunci jawaban
item dan mana option yang berfungsi sebagai pengecoh atau distractor. Disini
tester harus berusaha memperbaiki atau menggantinya dengan option yang lain
sedemikian rupa sehingga antara kunci jawaban dengan pengecoh sulit dibedakan
oleh testee. Setelah dilakukan perbaikan, item yang bersangkutan dicoba untuk
dikeluarkan lagi pada tes hasil belajar selanjutnya. Tujuannya adalah untuk
mengetahui apakah derajat kesukaran item itu menjadi lebih baik atau tidak
daripada yang sebelumnya. (3) seperti halnya butir-butr item yang terlalu
sukar, butir-butir item yang terlalu mudah juga masih mengandung manfaat, yaitu
bahwa butr-butir item yang termasuk dalam kategori ini dapat dimanfaatkan pada
tes-tes yang sifatnya longgar, dalam arti bahwa sebagian besar dari testee akan
dinyatakan lulus dalam tes seleksi tersebut. Dalam kondisi seperti ini sangat
bijaksana apabila butir-butir item yang dikeluarkan dalam tes seleksi tersebut
adalah butir-butir item yang termasuk dalam kategori terlalu mudah, sehingga
tes seleksi itu boleh dikatakan hanya sebagai formalitas saja.
Dari
uraian di atas, maka tidak ada jeleknya untuk memasukkan butir-butir item yang
termasuk kategori terlalu sukar dan terlalu mudah di dalam buku bank soal,
sebab sewaktu-waktu butir-butir semacam itu diperukan, tester tidak perlu
membuat atau menyusun butir-butir item dengan derajat kesukaran dan derajat
kemudahan yang tinggi.
Kembali
pada pembicaraan tentang rumus untukmencari atau menghitung P yang telah
dikemukakan sebelumnya, maka proporsa itu sebenarnyaadalah merupakan rata-rata
hitung yang berhasil diraih oleh seluruh testee untuk butir item yang
bersangkutan, dimana rumus itu Np tidak lain adalah ∑X yaitu jumlah skor-skor
jawaban benar dari tiap-tiap individu testee. Itulah sebabnya mengapa indeks
kesukaran item P sering dikenal dengan istilah angka indeks kesukaran rata-rata
inilah yang paling sering digunakan sebagai dasar untuk menentukan derajat
kesukaran item.
Namun
demikian, angka indeks ini bukanlah merupakan angka indeks yang tanpa cacat.
Kelemahan utama yang terdapat pada angka indeks kesukaran rata-rata P ialah,
adanya hubungan yang terbalik antara derajat kesukaran item dengan angka indeks
itu sendiri. Seperti yang sudah disampaikan sebelumnya, makin rendah angka
indeks kesukaran item yang dimiliki oleh sebutir item akan semakin tinggi
derajat kesukaran item tersebut. Sebaliknya semakin tinggi angka indeks
kesukaran yang dimiliki oleh sebutir item, maka derajat kesukaran item tersebut
semakin rendah. Jadi hubungan diantara keduanya merupakan hubungan yang
berlawanan arah. Itulah sebabnya mengapa orang cenderung untuk mengatakan bahwa
istilah angka indeks kesukaran item itu lebih tepat diganti dengan istilah
angka indeks kemudahan item atau angka indeks fasilitas item, dimana dengan
angka indeks kemudahan item itu terdapat kesejajaran arah antara angka indeks
kemudahan item dengan derajat kemudahannya, yaitu semakin tinggi angka indeks
kemudahan item maka derajat kemudahan item juga semakin rendah, sehingga lebih
rendah adanya hubungan langsung yang sifatnya searah antara tinggi rendahnya
angka indeks kemudahan item dengan derajat kemudahan item yang bersangkutan.
Cara
kedua untuk menghitung indeks adalah
dengan menggunakan skala kesukaran linier. Skala kesukaran linier ini disusun
dengan cara mentransformasikan nilai P menjadi nilai z, dimana perubahan dari P
ke z itu dilakukan dengan berkonsultasi pada tabel nilai z yang pada umumnya
dilampirkan pad buku-buku statistik.
Dengan
menggunakan cara yang kedua, maka memperhatikan langkah-langkah sebagai
berikut.
Langkah pertama dengan menggunakan rumus
:
Dimana
:
Pb=
P bersih
Pk=P
kotor
a=
option yang digunakan
1=
bilangan konstan
Sebelum
dilakukan perhitungan untuk memperoleh P bersih terlebih dahulu perlu
dikemukakan bahwa angka indeks kesukaran item (P) seperti yang sudah diuraikan
sebelumnya masih merupakan P yang bersifat kotor, karena P diperoleh tanpa
mempertimbangkan option atau alternative yang dipasang pada setiap butir item
yang sedang dianalisis derajat kesukarannya. Dengan P bersih maka derajat
kesukaran item itu telah dikoreksi dengan jalan memperhatikan option yang
dipasang pada setiap butir item yang bersangkutan.
Langkah kedua mentransformasikan nilai p
bersih menjadi nilasi z, dengan berkonultasi pada tabel kurva normal. Kita
ambil sebagai contoh P bersih yang dimiliki oleh butir item nomor. Butir item
nomor 9 memiliki P bersih sebesar 0,75. Untuk mentransformasikan P bersih
sebesar 0,75 itu menjadi nilasi z, kita cari angka sebesar 0,75 itu di dalam
tabel kurva normal terlampir.
Berdasarkan
hasil konsultasi pada tabel kurva normal, maka dengan P bersih sebesar 0,75
diperoleh harga z sebesar 0,6745. Dengan berpegang pada Patoka yang diberikan
oleh Robert L. Thorndike dan Elizabeth Hagen dalam bukunya yang berjudul Measurement and Evaluation in Psychology and
Education, seperti yang telah diungkapkan sebelumnya, maka dengan angka
indeks kesukaran item sebesar 0,6745 kita dapat menyatakan bahwa butir item
nomor 9 itu dinyatakan dalam kategori item yang teah memiliki derajat kesukaran
yang cukup.
Cara
lain selain berkonsultasi pada tabel kurva normal dengan menggunakan rumus :
Dimana:
Pb=
angka indeks kesukaran item setelah dikoreksi (P bersih)
B=
jumlah testee yang menjawab benar
S=
jumlah testee yang menjawab salah
a=
opsi yang diberikan pada setiap item
Langkah ketiga mencari atau menghitung
angka indeks kesukaran item ialah dengan menggunakan angka indeks davis. Angka
indeks Davis dapat diperoleh dengan rumus :
D
= 21,063 z + 50
Keuntungan dari penggunaan indeks Davis ini adalah bahwa kita
akan dapat terhindar dari tanda negative atau tanda minus, seperti yang
dimungkinkan terjadi apabila kita menggunakan skala kesukaran linier.
Cara menggunakan indeks Davis sebagai petunjuk tentang
derajat kesukaran item adalah seperti dikemukakan pada contoh berikut ini.
Misalkan sebutir item memiliki P kotor
sebesar 0,265. Dengan berkonsultasi pada tabel kurva normal diperoleh z sebesar
0,6280. Dengan menggunakan rumu angka indeks Davis, maka :
D = 21,063 z + 50
= (21,063) (0,6280)
+ 50
= 13,227564 + 50
= 63,2274564
= 63,23
Karena rentangan angka indeks Davis adalah antara 0 sampai
100, maka dengan D sebesar 63,23 kita dapat menyatakan bahwa butir item yang
bersangkutan memiliki derajat kesukaran yang cukup/sedang (D sebesar 63,23 itu
berada antara 30-70).
Jika kita ingin memperoleh angka indeks Davis secara cepat,
maka kita dapat menggunakan sebuah tabel yang disebut tabel untuk mengestimasi
nilai D (indeks Davis).
2.
Teknik Analisis Daya
Pebeda Item
Daya
pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat
membedakan antara testee yang berkembang tinggi (pandai) dengan testee yang
berkembang rendah (bodoh) sedemikian rupa sehingga sebagian besar testee dapat
menjawab soal dengan betul sementara testee yang memiliki kemampuan rendah
tersebut sebagian besar tidak dapat menjawab item dengan betul.
Mengetahui
daya pembeda itu penting sekali, sebab salah satu dasar yang dipegangi untuk
menyusun butir-butir item tes hasil belajar adalah adanya anggapan, bahwa
kemampuan antar testee yang satu dengan testee yang lain itu berbeda-beda, dan
bahwa butir-butir item tes hasil belajar itu haruslah mampu memberikan hasil
tes yang mencerminkan adanya perbedaan-perbedaan kemampuan yang terdapat
dikalangan testee tersebut.
Sejalan
dengan pernyataan di atas maka kegiatan analisis terhadap daya pembeda item itu
ditunjukkan untuk menjawab pertanyaan “apakah testee yang kita anggap pandai
jawabannya pada umumnya betul, dan apakah testee yang kita anggap bodoh itu
pada umumnya jawabannya salah?”. Jika jawaban atas pertanyaan itu adalah “ya”,
maka butir item yang bersangkutan dapat kita anggap sebagai butir item yang
baik, dalam arti bahwa butir item tersebut telah menunjukkan kemampuanya
didalam membedakan antara testee yang termasuk dalam kategori pandai dengan
testee yang termasuk dalam kategori bodoh.
Sebaliknya,
jika jawaban atas pertanyaan tersebut adalah “tidak”, maka butir item yang
bersangkutan dapat dinyatakan sebagai butir item jelek, sebab hasil yang
dicapai dalam tes itu justru bertentangan atau berlawanan dengan tujuan tes itu
sendiri.
Daya
pembeda dapat diketahui dengan melihat besar kecilnya angka indeks deskriminasi
item. Angka indeks diskriminasi item adalah sebuah angka atau bilangan yang
menunjukkan besar kecilnya daya pembeda yang dimiliki oleh sebutir item. Daya
pembeda pada dasarnya dihitung atas dasar pembagiantestee ke dalam dua
kelompok, yaitu kelompok atas (kelompok yang tergolong pandai) dan kelompok
bawah (kelompok yang tergolong bodoh).
Untuk
mengetahui besar kecilnya angka indeks deskriminasi dapat dilakukan dengan dua
macam rumus antara lain:
Rumus
pertama
D = PA
– PB atau D = PH -
PL
Rumus kedua
Untuk mengetahui angka indeks deskriminasi
item D, ditempuh langkah-langkah sebagai berikut: (1) mengelompokkan testee
menjadi beberapa kelompok yaitu kelompok atas (pandai) dan kelompok bawah
(bodoh), (2) memberi kode-kode terhadap hasil pengelompokkan testee, (3)
menghitung BA, BB, PA, PB, (4)
memberikan penafsiran mengenai kualitas daya pembeda item yang dimiliki oleh
satu butir item tes hasil belajar.
3.
Teknik analisis fungsi
distractor
Pada saat membicarakan tentag tes obyektif bentuk multiple
choice item telah dikemukakan bahwa pada tes bentuk multiple choice item
tersebut untuk setiap butir item yang dikeluarkan dalam tes hasil belajar sudah
dilengkapi dengan beberapa kemungkinan jawaban, atau yang sering dikenal dengan
istilah option.
Option atau altrnatif ini jumlahnya berkisar antara tiga
sampai dengan lima buah, dan dari kemungkinan-kemungkinan jawaban yang dipasang
pada setiap butir item itu salah satu merupakan jawaban yang betul, dan sisanya
itu merupakan jawaban yang salah. Jawaban-jawaban yang salah itulah yang bisa
dikenal dengan istilah distractor.
Tujuan
utama dari pemasangan distractor pada setiap butir item yaitu agar dari sekian
banyak testee yang menikuti tes hasil
belajar ada yang tertarik untuk memilihnya, sebab mereka akan mengira bahwa
jawaban yang merepilih adalah jawaban betul. Jadi mereka akan terkecoh,
menganggap bahwa distractor yang
terpasang pada item itu sebagai kunci jawaban, padahal bukan. Dengan kata lain
distractor baru dapat menjalankan fungsinya dengan baik jika distraktor telah
memiliki daya rangsang yang membuat testee terkecoh. Menganalisis fungsi
distractor sering dikenal dengan istilah menganalisis pola penyebaran jawaban item.
Menganalisis
fungsi distractor sering dikenal dengan istilah lain, yaitu: menganalisis pola
enyebaran jawaban item. Adapaun yang dimaksud dengan pola penyebaran jawaban
item adalah suatu pola yang dapat menggambarkan bagaimana testee menentukan
pilihan jawabannya terhadap kemungkinan-kemungkinan jawaban yang telah
dipasangkan pada setiap butir item.
Dalam
hubungannya dengan pe,bicaraan tentang pengecoh atau distractor, cara yang
dapat digunakan untuk menentukan apakah suatu distractor tersebut dudah dapat
menjalankan fungsinya dengan baik atau tidak, ada beberapa hal yang perlu
ditekankan. Kelaziman yang berlaku dalam dunia evaluasi hasil belajar ialah,
bahwa distractor dinyatakan telah dapat menjalankan fungsinya dengan baik
apabila distractor tersebut sekurang-kurangnya sudah dipilih oleh 5% dari
seluruh peserta. Misalnya tes hasi belajar diikuti oleh 100 testee. Distractor
yang dipasang pada item tersebut dapat dinyatakan berfungsi apabila minimal 5
orang dari 100 testee sudah terkecoh untuk memilih distractor tersebut.
PENUTUTP
Untuk mengetahui tes tersebut termasuk ke dalam kategori tes
yang bagus atau tidak, kita bisa melakukan sebuah pengujian yang disebut dengan
analisis item. Penganilisisan terhadap item butir-butir tes hasil belajar dapat
dilakukan dari tiga segi, yang pertama dari segi derajat kesukaran, yang kedua
dari segi daya pembeda itemnya dan yang terakhir dari segi fungsi
distraktornya.
Tindak lanjut dari butir-butir item yang sudah dianalisis
yaitu : yang termasuk kategori item yang sedang bisa digunakan untuk tes
selanjutnya, yang termasuk kategori item yang sulit maupun yang mudah
dianalisis kembali atau diperbaiki sedemikian rupa, kemudia dimasukkan ke dalam
buku bank soal dan digunakan lagi untuk spesifikasi tes tertentu.
Tidak ada komentar:
Posting Komentar