DUNIA PELAJAR: MAKALAH TENTANG EVALUASI

ANALISIS ITEM UNTUK MENGUJI KUALITAS TES

Pendahuluan

Salah satu tugas yang penting sering dilupakan oleh staf pengajar baik itu guru maupun dosen adalah melakukan sebuah evaluasi terhadap alat ukur yang telah digunakan untuk mengukur keberhasilan belajar dari peserta didiknya. Salah satu alat ukur tersebut adalah tes hasil belajar.

Banyak terlihat dalam kenyataan jika hasil tes menunjukkan nilai di bawah rata-rata maka kesalahan itu dilimpahkan pada pesereta didik atau testee (yang mengerjakan tes), sehingga menganggap bahwa dalam kumpulan testee yang diberikan tes tersbut terdiri dari anak-anak yang bodoh. Pernyataan seperti itu kemungkinan bisa benar namun bisa juga salah.

Begitu juga sebaliknya, jika asil dari tes menunjukkan nilai di atas rata-rata, maka ada pemikiran bahwa siswa memahami materi dengan baik. Dan guru atau tester akan beranggapan bahwa anak-anak yang diberikan tes tersebut terdiri dari anak-anak yang pintar. Pandangan atau pendapat seperti itu juga kemungkinan benar dan tidak memungkinkan juga salah.

Untuk mengatasi hal tersebut hendaknya pandangan yang tidak bersifat global tersebut ditangkas dengan pandangan seorang tester atau staf pengajar yang mampu memiliki pemikiran yang global. Artinya penyebab suatu permasalahan tersebut dikaji lebih baik lagi, sehingga suatu permasalahan tersebut bisa diketahui secara pasti apa penyebabnya.

Anggapan atau pandangan yang diungkapkan di atas merupakan pandangan atau anggapan yang tidak bisa dibuktikan kebenarannya. Pamdangan tersebut masih memiliki kerancuan dalam pembuktiannya. Untuk megatasi hal tersebut tentunya kita harus memikirkan beberapa factor.

Salah satu factor penyebab dari hasil tes yang bagus maupun yang tidak bagus adalahtes yang diberikan tersebut. Tes yang merupakan alat ukur keberhasilan siswa dalam pembelajaran juga memiliki peran penting. Apabila tes tersebut tidak tepat sasaran, tidak sesuai dengan kriteria tes yang baik atau yang sesuai, maka secara otomatis hasil yang diterima juga tidak sesuai. Maka dari itu dalam memberikan sebuah tes jua harus dipertimbangkan kriteria tes yang sesuai untuk testee.

Untuk mengetahui tes tersebut termasuk ke dalam kategori tes yang bagus atau tidak, kita bisa melakukan sebuah pengujian yang disebut dengan analisis item. Analisis item ini dilakukan dengan melakukan penelusuran dan pelacakan degan cermat terhadap butir-butir soal atau item yang merupaka bagian yang tidak terpisahkan dari yang namanya tes hasil belajar sebagai totalitas. Penelusuran atau pelacakan itu dilakukan oleh tester dengan tujuan mengetahui, apakah butir-butir item yang membangun tes hasil belajar itu sudah dapat menjalankan fungsinya sebagai alat pengukur hasil belajar yang memadai atau belum. Identifikasi terhadap setiap butir item tes hasil belajar itu dilakukan dengan harapan akan menghasilkan berbagai informasi berharga, yang pada dasarnya akan merupakan umpan balik guna melakukan perbaikan, pembenahan dan penyempurnaan kembali terhadap butir-butr item yang telah dikeluarkan dalam tes hasil belajar, sehingga pada masa-masa yang akan datang tes hasil belajar disusun dan dirancang oleh tester benar-benar dapat menjalankan fungsinya sebagai alat pengukur tes hasil belajar yang berkualitas tinggi.

Permasalahnya bagaimana kita bisa melakukan analisis terhadap item-item yang terdapat dalam tes hasil belajar. Dari segi apa kita bisa melakukan analisis item tersebut. Dan apa tindak lanjut terhadap item yang sudah dilakukan pengecekan kualitas item tersebut. Untuk bisa mengatasi semua permasalahan tersebut, maka selanjutnya akan dibahas mengenai teknik penganalisisan tes hasil belajar.

PEMBAHASAN

Penganilisisan terhadap item butir-butir tes hasil belajar dapat dilakukan dari tiga segi, yang pertama dari segi derajat kesukaran, yang kedua dari segi daya pembeda itemnya dan yang terakhir dari segi fungsi distraktornya.

1. Teknik analisis derajat kesukaran

Bermutu atau tidaknya butir-butir item tes hasil belajar pertama-tama dapt diketahui dari derajat kesukaran atau taraf kesulitan yang dimiliki oleh masing-masing butir item tersebut. Butir-butir item tes hasil belajar dapat dinyatakan sebagai butir-butir item yang baik, apabila butir-butir item tersebut tidak terlalu sukar dan tidak pula terlalu mudah. Dengan kata lain derajat kesukaran item tersebut adalah sedang atau cukup.

Bertitik tolak dari pernyataan tersebut, maka butir-butir item tes hasil belajar dimana seluruh testee tidak dapat menjawab dengan betul (karena terlalu sukar) tidak dapat disebut sebagai item yang baik. Demikian juga sebaliknya, butir-butir item tes hasil belajar dimana seluruh testee dapat menjawab dengan betul (karena terlalu mudah) juga tidak dapat digongkan kedalam kategori item yang baik.

Cara apa yang digunakan untuk mengetahui butir-butir item tes hasil belajar tertentu yang dapat dikatakan sudah memiliki derajat kesukaran yang memadai? Witheringthon dalam bukunya yang berjudul Psychological Education, mengatakan bahwa, sudah atau belum memadainya derajat kesukaran item tes hasil belajar dapat diketahui dari besar kecilnya angka yang melambangkan tingkat kesulitan dari item tersebut. Angka yang dapat memberikan petunjuk mengenai tingkat kesulitan item tersebut dikenal dengan istilah difficulty index (angka indeks kesukaran item), yang dalam dunia evaluasi hasil belajar umumnya dilambangkan dengan huruf P yang merupakan singkatan dari proporsi.

Menurut Whiterington, angka indeks kesukaran item tersebut besarnya berkisar antara 0,00 sampai dengan 0,01. Artinya angka indeks kesukaran paling rendah adalah 0,00 dan paling tinggi adalah 1,00. Angka indeks 0,00 merupakan petunjuk bagi tester bahwa item butir-butir tes hasil belajar tersebut terlalu sukar. Sebaliknya, jika angka indeks 0,01 merupakan bahwa butir item yang bersangkutan terlalu mudah.

Untuk memperoleh angka indeks tersebut menggunakan rumus :

Dimana :

P = proporsi atau angka indeks kesukaran (P kotor)

N_p = jumlah testee yang menjawab benar

N = jumlah testee

Setelah berhasil diidentifikasi butir-butir item mana yang derajat kesukarannya termasuk dalam kategori cukup, terlalu sukar dan terlalu mudah maka yang menjadi pokok permasalahan sekarang adalah, bagaimana menindaklanjuti hasil analisis item tersebut?

Dalam kaitannya dengan hasil analisis item dari segi derajat kesukaran, maka tindak lanjut yang perlu dilakukan oleh tester adalah sebagai berikut.

Pertama, untuk butir-butir item yang berdasarkan hasil analisis termasuk dalam kategori baik, seyogyanya butir item tersebut segera dicata dalam buku bank soal. Selanjutnya butir-butir soal tersebut dapat dikeluarkan lagi dalam tes-tes hasil belajar pada waktu-waktu yang akan datang.

Kedua, untuk butir-butir item yang termasuk dalam kategori terlalu sukar, ada tiga kemungkinan tidak lanjut, yaitu : (1) Butim item tersebut dibuang atau didrop dan tidak akan dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang. (2) diteliti ulang, dilacak dan ditelusuri sehingga dapat diketahui factor yang menyebabkan butir item yang bersangkutan sulit dijawab oleh testee; apakah kalimat soalnya kurang jelas, apakah petunjuk petunjuk cara mengerjakan atau menjawab soalnya sulit dipahami, atau dalam soal terdapat istilah-istilah yang tidak jelas. Setelah dilakukan perbaikan kembali, butir-butir item tersebut dikeluarkan lagi dalam tes hasil belajar yang akan datang. (3) haruslah dipahami bahwa tidak setiap butir item yang termasuk dalam kategori terlalu sukar itu sama sekali tidak memiliki kegunaan. Butir-butir item yang terlalu sukar itu sewaktu-waktu masih dapat diambil manfaatnya, yaitu dapat digunakan dalam tes-tes (terutama tes seleksi) yang sifatnya sangat ketat. Dalam kondisi seperti itu sangat tepat apabila butir-butir item yang dikeluarkan adalah butir-butir item yang termasuk kategori terlalu sukar dengan asumsi bahwa testee dengan kemampuan yang rendah dengan mudah akan tersisihkan dari seleksi, sedangkan testee yang memiliki kemampuan tinggi tidak akan terlalu sukar untuk lolos dalam seleksi tersebut.

Ketiga, untuk butir-butir item yang termasuk dalam kategori terlalu mudah, juga ada tiga kemungkinan tindak lanjut, yaitu: (1) butir item tersebut dibuang atau didrop dan tidak akan dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang. (2) diteliti ulang, dilacak dan ditelusuri secara cermat guna mengetahui factor yang menyebabkan butir item tersebut dapat dijawab betul oleh hamper seluruh testee; ada kemungkinan option atau alternative yang dipasangkan pada butir-butir item yang bersangkutan terlalu mudah diketahui oleh testee, mana item yang merupakan kunci jawaban item dan mana option yang berfungsi sebagai pengecoh atau distractor. Disini tester harus berusaha memperbaiki atau menggantinya dengan option yang lain sedemikian rupa sehingga antara kunci jawaban dengan pengecoh sulit dibedakan oleh testee. Setelah dilakukan perbaikan, item yang bersangkutan dicoba untuk dikeluarkan lagi pada tes hasil belajar selanjutnya. Tujuannya adalah untuk mengetahui apakah derajat kesukaran item itu menjadi lebih baik atau tidak daripada yang sebelumnya. (3) seperti halnya butir-butr item yang terlalu sukar, butir-butir item yang terlalu mudah juga masih mengandung manfaat, yaitu bahwa butr-butir item yang termasuk dalam kategori ini dapat dimanfaatkan pada tes-tes yang sifatnya longgar, dalam arti bahwa sebagian besar dari testee akan dinyatakan lulus dalam tes seleksi tersebut. Dalam kondisi seperti ini sangat bijaksana apabila butir-butir item yang dikeluarkan dalam tes seleksi tersebut adalah butir-butir item yang termasuk dalam kategori terlalu mudah, sehingga tes seleksi itu boleh dikatakan hanya sebagai formalitas saja.

Dari uraian di atas, maka tidak ada jeleknya untuk memasukkan butir-butir item yang termasuk kategori terlalu sukar dan terlalu mudah di dalam buku bank soal, sebab sewaktu-waktu butir-butir semacam itu diperukan, tester tidak perlu membuat atau menyusun butir-butir item dengan derajat kesukaran dan derajat kemudahan yang tinggi.

Kembali pada pembicaraan tentang rumus untukmencari atau menghitung P yang telah dikemukakan sebelumnya, maka proporsa itu sebenarnyaadalah merupakan rata-rata hitung yang berhasil diraih oleh seluruh testee untuk butir item yang bersangkutan, dimana rumus itu Np tidak lain adalah ∑X yaitu jumlah skor-skor jawaban benar dari tiap-tiap individu testee. Itulah sebabnya mengapa indeks kesukaran item P sering dikenal dengan istilah angka indeks kesukaran rata-rata inilah yang paling sering digunakan sebagai dasar untuk menentukan derajat kesukaran item.

Namun demikian, angka indeks ini bukanlah merupakan angka indeks yang tanpa cacat. Kelemahan utama yang terdapat pada angka indeks kesukaran rata-rata P ialah, adanya hubungan yang terbalik antara derajat kesukaran item dengan angka indeks itu sendiri. Seperti yang sudah disampaikan sebelumnya, makin rendah angka indeks kesukaran item yang dimiliki oleh sebutir item akan semakin tinggi derajat kesukaran item tersebut. Sebaliknya semakin tinggi angka indeks kesukaran yang dimiliki oleh sebutir item, maka derajat kesukaran item tersebut semakin rendah. Jadi hubungan diantara keduanya merupakan hubungan yang berlawanan arah. Itulah sebabnya mengapa orang cenderung untuk mengatakan bahwa istilah angka indeks kesukaran item itu lebih tepat diganti dengan istilah angka indeks kemudahan item atau angka indeks fasilitas item, dimana dengan angka indeks kemudahan item itu terdapat kesejajaran arah antara angka indeks kemudahan item dengan derajat kemudahannya, yaitu semakin tinggi angka indeks kemudahan item maka derajat kemudahan item juga semakin rendah, sehingga lebih rendah adanya hubungan langsung yang sifatnya searah antara tinggi rendahnya angka indeks kemudahan item dengan derajat kemudahan item yang bersangkutan.

Cara kedua untuk menghitung indeks adalah dengan menggunakan skala kesukaran linier. Skala kesukaran linier ini disusun dengan cara mentransformasikan nilai P menjadi nilai z, dimana perubahan dari P ke z itu dilakukan dengan berkonsultasi pada tabel nilai z yang pada umumnya dilampirkan pad buku-buku statistik.

Dengan menggunakan cara yang kedua, maka memperhatikan langkah-langkah sebagai berikut.

Langkah pertama dengan menggunakan rumus :

Dimana :

P_b= P bersih

P_k=P kotor

a= option yang digunakan

1= bilangan konstan

Sebelum dilakukan perhitungan untuk memperoleh P bersih terlebih dahulu perlu dikemukakan bahwa angka indeks kesukaran item (P) seperti yang sudah diuraikan sebelumnya masih merupakan P yang bersifat kotor, karena P diperoleh tanpa mempertimbangkan option atau alternative yang dipasang pada setiap butir item yang sedang dianalisis derajat kesukarannya. Dengan P bersih maka derajat kesukaran item itu telah dikoreksi dengan jalan memperhatikan option yang dipasang pada setiap butir item yang bersangkutan.

Langkah kedua mentransformasikan nilai p bersih menjadi nilasi z, dengan berkonultasi pada tabel kurva normal. Kita ambil sebagai contoh P bersih yang dimiliki oleh butir item nomor. Butir item nomor 9 memiliki P bersih sebesar 0,75. Untuk mentransformasikan P bersih sebesar 0,75 itu menjadi nilasi z, kita cari angka sebesar 0,75 itu di dalam tabel kurva normal terlampir.

Berdasarkan hasil konsultasi pada tabel kurva normal, maka dengan P bersih sebesar 0,75 diperoleh harga z sebesar 0,6745. Dengan berpegang pada Patoka yang diberikan oleh Robert L. Thorndike dan Elizabeth Hagen dalam bukunya yang berjudul Measurement and Evaluation in Psychology and Education, seperti yang telah diungkapkan sebelumnya, maka dengan angka indeks kesukaran item sebesar 0,6745 kita dapat menyatakan bahwa butir item nomor 9 itu dinyatakan dalam kategori item yang teah memiliki derajat kesukaran yang cukup.

Cara lain selain berkonsultasi pada tabel kurva normal dengan menggunakan rumus :

Dimana:

P_b= angka indeks kesukaran item setelah dikoreksi (P bersih)

B= jumlah testee yang menjawab benar

S= jumlah testee yang menjawab salah

a= opsi yang diberikan pada setiap item

Langkah ketiga mencari atau menghitung angka indeks kesukaran item ialah dengan menggunakan angka indeks davis. Angka indeks Davis dapat diperoleh dengan rumus :

D = 21,063 z + 50

Keuntungan dari penggunaan indeks Davis ini adalah bahwa kita akan dapat terhindar dari tanda negative atau tanda minus, seperti yang dimungkinkan terjadi apabila kita menggunakan skala kesukaran linier.

Cara menggunakan indeks Davis sebagai petunjuk tentang derajat kesukaran item adalah seperti dikemukakan pada contoh berikut ini. Misalkan sebutir item memiliki P kotor sebesar 0,265. Dengan berkonsultasi pada tabel kurva normal diperoleh z sebesar 0,6280. Dengan menggunakan rumu angka indeks Davis, maka :

D = 21,063 z + 50

= (21,063) (0,6280) + 50

= 13,227564 + 50

= 63,2274564

= 63,23

Karena rentangan angka indeks Davis adalah antara 0 sampai 100, maka dengan D sebesar 63,23 kita dapat menyatakan bahwa butir item yang bersangkutan memiliki derajat kesukaran yang cukup/sedang (D sebesar 63,23 itu berada antara 30-70).

Jika kita ingin memperoleh angka indeks Davis secara cepat, maka kita dapat menggunakan sebuah tabel yang disebut tabel untuk mengestimasi nilai D (indeks Davis).

2. Teknik Analisis Daya Pebeda Item

Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan antara testee yang berkembang tinggi (pandai) dengan testee yang berkembang rendah (bodoh) sedemikian rupa sehingga sebagian besar testee dapat menjawab soal dengan betul sementara testee yang memiliki kemampuan rendah tersebut sebagian besar tidak dapat menjawab item dengan betul.

Mengetahui daya pembeda itu penting sekali, sebab salah satu dasar yang dipegangi untuk menyusun butir-butir item tes hasil belajar adalah adanya anggapan, bahwa kemampuan antar testee yang satu dengan testee yang lain itu berbeda-beda, dan bahwa butir-butir item tes hasil belajar itu haruslah mampu memberikan hasil tes yang mencerminkan adanya perbedaan-perbedaan kemampuan yang terdapat dikalangan testee tersebut.

Sejalan dengan pernyataan di atas maka kegiatan analisis terhadap daya pembeda item itu ditunjukkan untuk menjawab pertanyaan “apakah testee yang kita anggap pandai jawabannya pada umumnya betul, dan apakah testee yang kita anggap bodoh itu pada umumnya jawabannya salah?”. Jika jawaban atas pertanyaan itu adalah “ya”, maka butir item yang bersangkutan dapat kita anggap sebagai butir item yang baik, dalam arti bahwa butir item tersebut telah menunjukkan kemampuanya didalam membedakan antara testee yang termasuk dalam kategori pandai dengan testee yang termasuk dalam kategori bodoh.

Sebaliknya, jika jawaban atas pertanyaan tersebut adalah “tidak”, maka butir item yang bersangkutan dapat dinyatakan sebagai butir item jelek, sebab hasil yang dicapai dalam tes itu justru bertentangan atau berlawanan dengan tujuan tes itu sendiri.

Daya pembeda dapat diketahui dengan melihat besar kecilnya angka indeks deskriminasi item. Angka indeks diskriminasi item adalah sebuah angka atau bilangan yang menunjukkan besar kecilnya daya pembeda yang dimiliki oleh sebutir item. Daya pembeda pada dasarnya dihitung atas dasar pembagiantestee ke dalam dua kelompok, yaitu kelompok atas (kelompok yang tergolong pandai) dan kelompok bawah (kelompok yang tergolong bodoh).

Untuk mengetahui besar kecilnya angka indeks deskriminasi dapat dilakukan dengan dua macam rumus antara lain:

Rumus pertama

D = P_A – P_Batau D = P_H - P_L

Rumus kedua

Untuk mengetahui angka indeks deskriminasi item D, ditempuh langkah-langkah sebagai berikut: (1) mengelompokkan testee menjadi beberapa kelompok yaitu kelompok atas (pandai) dan kelompok bawah (bodoh), (2) memberi kode-kode terhadap hasil pengelompokkan testee, (3) menghitung B_A, B_B, P_A,P_B,(4) memberikan penafsiran mengenai kualitas daya pembeda item yang dimiliki oleh satu butir item tes hasil belajar.

3. Teknik analisis fungsi distractor

Pada saat membicarakan tentag tes obyektif bentuk multiple choice item telah dikemukakan bahwa pada tes bentuk multiple choice item tersebut untuk setiap butir item yang dikeluarkan dalam tes hasil belajar sudah dilengkapi dengan beberapa kemungkinan jawaban, atau yang sering dikenal dengan istilah option.

Option atau altrnatif ini jumlahnya berkisar antara tiga sampai dengan lima buah, dan dari kemungkinan-kemungkinan jawaban yang dipasang pada setiap butir item itu salah satu merupakan jawaban yang betul, dan sisanya itu merupakan jawaban yang salah. Jawaban-jawaban yang salah itulah yang bisa dikenal dengan istilah distractor.

Tujuan utama dari pemasangan distractor pada setiap butir item yaitu agar dari sekian banyak testee yang menikuti tes hasil belajar ada yang tertarik untuk memilihnya, sebab mereka akan mengira bahwa jawaban yang merepilih adalah jawaban betul. Jadi mereka akan terkecoh, menganggap bahwa distractor yang terpasang pada item itu sebagai kunci jawaban, padahal bukan. Dengan kata lain distractor baru dapat menjalankan fungsinya dengan baik jika distraktor telah memiliki daya rangsang yang membuat testee terkecoh. Menganalisis fungsi distractor sering dikenal dengan istilah menganalisis pola penyebaran jawaban item.

Menganalisis fungsi distractor sering dikenal dengan istilah lain, yaitu: menganalisis pola enyebaran jawaban item. Adapaun yang dimaksud dengan pola penyebaran jawaban item adalah suatu pola yang dapat menggambarkan bagaimana testee menentukan pilihan jawabannya terhadap kemungkinan-kemungkinan jawaban yang telah dipasangkan pada setiap butir item.

Dalam hubungannya dengan pe,bicaraan tentang pengecoh atau distractor, cara yang dapat digunakan untuk menentukan apakah suatu distractor tersebut dudah dapat menjalankan fungsinya dengan baik atau tidak, ada beberapa hal yang perlu ditekankan. Kelaziman yang berlaku dalam dunia evaluasi hasil belajar ialah, bahwa distractor dinyatakan telah dapat menjalankan fungsinya dengan baik apabila distractor tersebut sekurang-kurangnya sudah dipilih oleh 5% dari seluruh peserta. Misalnya tes hasi belajar diikuti oleh 100 testee. Distractor yang dipasang pada item tersebut dapat dinyatakan berfungsi apabila minimal 5 orang dari 100 testee sudah terkecoh untuk memilih distractor tersebut.

PENUTUTP

Untuk mengetahui tes tersebut termasuk ke dalam kategori tes yang bagus atau tidak, kita bisa melakukan sebuah pengujian yang disebut dengan analisis item. Penganilisisan terhadap item butir-butir tes hasil belajar dapat dilakukan dari tiga segi, yang pertama dari segi derajat kesukaran, yang kedua dari segi daya pembeda itemnya dan yang terakhir dari segi fungsi distraktornya.

Tindak lanjut dari butir-butir item yang sudah dianalisis yaitu : yang termasuk kategori item yang sedang bisa digunakan untuk tes selanjutnya, yang termasuk kategori item yang sulit maupun yang mudah dianalisis kembali atau diperbaiki sedemikian rupa, kemudia dimasukkan ke dalam buku bank soal dan digunakan lagi untuk spesifikasi tes tertentu.

DUNIA PELAJAR

TUGAS

Jumat, 03 Januari 2014

MAKALAH TENTANG EVALUASI

Tidak ada komentar:

Posting Komentar