Bila analisis butir soal dilakukan secara manual, maka akan memerlukan waktu yang sangat lama dan berpotensi memiliki kemungkinan ada kesalahan, olehnya itu perlu menjelaskan tentang hal-hal yang berhubungan dengan analisis butir soal, seperti: pengertian tes, pengertian reliabilitas dan validitas, tingkat kesukaran butir tes, nilai rata-rata, daya pembeda dan efektifitas pengecoh.
Pengertian Tes
Banyak pengertian atau definisi tentang tes yang dikemukakan oleh para ahli, sehingga pengertian yang baku mengenai tes belum ada. Namun secara umum, pengertian tes adalah seperangkat alat penilaian. Menurut Arikunto (2002:53), tes merupakan alat atau prosedur yang digunakan untuk mengetahui sesuatu dalam suasana, dengan cara dan aturan-aturan yang sudah ditentukan.
Pengertian Validitas
Surapranata (2004:50) menyatakan bahwa “validitas adalah suatu konsep yang berkaitan dengan sejauhmana tes telah mengukur apa yang seharusnya diukur”. Tujuan validitas soal adalah untu menentukan dapat tidaknya suatu soal tersebut membedakan kelompok dalam aspek yang diukursesuai dengan perbedaan yang ada dalam kelompok itu. Validitas tes perlu dilakukan untuk mengetahui kualitas tes dalam kaitannya mengukur hal yang seharusnya diukur.
Supranata (2004:60-61) menyatakan bahwa ada beberapa cara untuk menentukan validitas, diataranya dengan menggunakan:
- Indeks Diskriminasi
- Indeks Korelasi
- Indeks Keselarasan
Pengertian Reliabilities
Menurut Arikunto (2002:86), sebuah alat tes dikatakan reliable atau mempunyai taraf kepercayaan yang tinggi apabila alat tes tersebut dapat memberikan hasil yang tetap. Sedangkan, Djiwandono (1996) menyatakan bahwa: “. . . reliabilitas diartikan sebagai ciri tes yang memiliki kemampuan untuk menghasilkan pengukuran yang ajeg, tidak berubah-ubah, sedandainya digunakan secara berulang-ulang pada sasaran yang sama”
Dengan demikian, pengertian reliabel berhubungan dengan ketetapan hasil tes. Untuk menunjukkan reliabilitas suatu tes, banyak model, rumus atau teori yang digunakan. Dalam analisis butir soal ini, penulis menggunakan rumus KR-21.
Tingkat Kesukaran Butir Tes
Mengetahui tingkat kesukaran soal amat penting, karena hal ini akan memberikan berbagai macam alat diagnostik kesulitan belajar peserta didik ataupun dalam rangka meningkatkan penilaian berbasis kelas. Sebuah instrumen tes yang baik memiliki butir-butir dengan tingkat kesukaran yang proporsional, maksudnya instrumen tersebut tidak didominasi butir-butir tes yang sukar atau sebaliknya didominasi oleh butir-butir tes yang mudah atau sedang.
Instrumen tes yang baik memiliki perbandingan tingkat kesukaran mudah/sedang/sukar yang proporsional, misalnya; 1:2:1, 3:5:2, atau 2:5:3. Sedangkan nilai rata-rata atau mean adalah nilai dari jumlah skor secara keseluruhan dibagi jumlah peserta tes.
Daya Pembeda
Daya pembeda butir tes adalah kemampuan butir tes untuk membedakan siswa mampu dan kurang mampu. Indeks daya beda butir dihitung dengan menggunakan rumus, D=Ph – Pl, dimana Ph adalah proporsi kelomok atas yang menjawab benar, dan Pl adalah proporsi kelompok bawah yang menjawab benar. Pembagian kelompok ini didasarkan pada pendapat Kelly yang dikutip oleh Ratumanan dan Th. Laurens (2003:68) bahwa indeks daya beda butir yang lebih stabil dan sensitive dapat dicapai dengan menggunakan 27% kelompok atas dan 27% kelompok bawah.
Dengan demikian, dalam makalah ini karena jumlah peserta tes adalah 39 mahasiswa, maka 27% x 39 = 10.53. Karena hasilnya adalah 10.53, maka penulis membulatkan menjadi 11. Dengan demikian, penulis menentukan jumlah 22 mahasiswa yang terdiri atas 11 mahasiswa dari kelompok atas dan 11 mahasiswa dari kelompok bawah.
Efektifitas Pengecoh
Pengecoh (distractor option) dikatakan efektif jika memenuhi kriteria berikut: (a) jumlah pemilih kelompok atas harus kurang dari jumlah pemilih kelompok bawah (b) jumlah pemilih paling sedikit (minimal) 5% siswa pada kelompok atas dan kelompok bawah. Untuk menentukan efektifitas pengecoh kita menghitung pilihan siswa untuk setiap butir tes (kelompok atas dan kelompok bawah), kemudian kita gunakan criteria di atas untuk melihat tingkat efektifitasnya..