Jumat, 02 Desember 2011

Menyusun, Mengelola, dan Menilai Tes Kelas

Pendahuluan
Dalam urusan mempersiapkan rencana tes dan membangun item tes yang relevan harus diikuti dengan urusan serupa di .... Meninjau dan mengedit item ... mengatur item dalam ujian .... Mempersiapkan dengan jelas arahnya ... mereproduksi tes ... dan mengelola dan menilai hasil tes ... kelas juga dapat ditingkatkan dengan menerapkan metode sederhana analisis item ... dan membangun-item tes.

Pengujian kelas yang efektif dimulai dengan rencana tes yang secara khusus menggambarkan tujuan instruksional dan konten yang akan diukur dan relatif penekanan yang harus diberikan kepada masing-masing hasil pembelajaran. Ini diikuti dengan pemilihan item yang paling sesuai format (misalnya, pilihan ganda, esai) dan persiapan tes item yang relevan dengan hasil pembelajaran yang ditetapkan dalam rencana tes. Satu-satunya cara kita dapat memastikan bahwa tes kelas akan melayani tujuan yang telah ditetapkan untuk mengidentifikasi hasil pembelajaran, kita ingin mengukur dan kemudian menguji untuk membangun benteng item yang menyebut kinerja spesifik yang dijelaskan dalam hasil pembelajaran. Kita juga harus mengumpulkan barang­-barang ke dalam tes, menyiapkan arah, melaksanakan tes, skor tes, menafsirkan dan menilai hasilnya.
Tujuan persiapan dan penggunaan tes kelas adalah untuk memperoleh  bukti yang sah bahwa murid belajar. Dalam analisis akhir, pengujian prestasi yang valid adalah produk akhir, dikontrol secara sistematis serangkaian langkah, dimulai dengan identifikasi tujuan instruksional dan berakhir dengan skor dan interpretasi hasil. Meskipun validitas dibangun dalam pembangunan selama pengujian item, sistematis prosedur Penyusunan, administrasi, dan skor yang lebih besar akan memberikan jaminan bahwa barang akan berfungsi sebagaimana dimaksud. Menilai konten pengujian setelah ujian telah dikelola dapat juga membantu meningkatkan kualitas item.

Penyusunan Tes Kelas  (Assembling the Classroom Test)
Persiapan soal pengujian digunakan dalam suatu tes lebih mudah jika item dicatat dengan baik, tes ditulis paling tidak beberapa hari sebelum digunakan, dan jika ada item tambahan dibangun.
Recording Uji Produk (Recording Test Item)
Ketika membangun soal tes, maka diharapkan untuk menulis masing-masing pada kartu indeks yang terpisah. Selain soal tes, kartu harus berisi informasi mengenai tujuan instruksional, hasil pembelajaran yang spesifik, dan konten diukur oleh soal tersebut. Sebuah ruang juga harus disediakan untuk item-analisa informasi, biasanya di bagian belakang kartu, untuk memungkinkan ruang untuk merekam data setiap kali digunakan.
Kartu soal menyediakan fleksibilitas. Sebagai soal akan diperiksa dan diedit, mereka dapat dihilangkan, ditambahkan, atau direvisi. Hal yang sama berlaku ketika mengatur item untuk pengujian, mereka dapat diatur dan disusun kembali hanya dengan menyortir kartu. Fleksibilitas sistem pencatatan ini juga membuat posissible untuk membangun sebuah file kartu item tes efektif untuk penggunaan masa depan.
Meninjau Uji Produk   (Reviewing Test Item)
Tidak peduli seberapa soal tes dengan hati-hati telah disusun, cacat secara tidak sengaja ada di dalam selama konstruksi. Ketika kami berkonsentrasi pada kejelasan dan konsistensi dari sebuah pertanyaan, petunjuk verbal dalam tanpa diketahui. Ketika kita mencoba untuk meningkatkan item kesulitan, kita tanpa sadar memperkenalkan beberapa ambiguitas. Seperti kita ulang soal untuk membuat pilihan yang salah lebih masuk akal, perilaku yang disebut maju oleh item soal tersebut secara tidak sengaja diubah. Singkatnya, kita fokus begitu erat pada beberapa aspek item konstruksi yang kita mengabaikan orang lain. Hal ini menyebabkan akumulasi kesalahan yang dapat mengganggu fungsi item. Cacat teknis seperti itu paling mudah dideteksi oleh (1) memeriksa barang-barang setelah mereka disisihkan selama beberapa hari dan (2) meminta seorang rekan guru untuk mengkaji dan mengkritik mereka.
Pertanyaan-pertanyaan berikut akan membantu Anda menganalisis kualitas setiap item :
1.      Apakah format soal sesuai untuk hasil belajar yang diukur? Langkah pertama adalah untuk memeriksa apakah format soal cocok untuk jenis kinerja murid yang dijelaskan dalam rencana tes. Tindakan kata kerja dalam pernyataan masing-masing hasil belajar khusus (misalnya, mendefinisikan, menjelaskan, mengident ifikasi) menunjukkan format konten yang lebih tepat)
2.      Apakah pengetahuan, pemahaman, atau keterampilan berpikir yang disebut maju dengan soal yang sesuai dengan hasil pembelajaran yang spesifik dan subjek-materi konten yang diukur? Ketika sebuah tabel spesifikasi telah digunakan sebagai dasar untuk membangun item tes, ini hanya masalah memeriksa untuk melihat apakah item tersebut masih relevan dengan sel yang sama dalam tabel.
3.      Adakah titik item soal tersebut jelas? Sebuah tes seksama terhadap item sering mengungkapkan ambiguitas, kosa kata yang tidak pantas, dan canggung struktur kalimat yang diabaikan selama konstruksi. Kembali untuk menguji item setelah mereka disisihkan selama beberapa hari memberikan pandangan segar yang membuat cacat seperti itu lebih jelas. Kesulitan dart kosa kata dan kompleksitas struktur kalimat harus, tentu saja, harus dinilai dalam kaitannya dengan murid dalam tingkat kematangan. Di semua tingkat, bagaimanapun, ambiguitas harus dihapus. Dalam bentuk akhirnya, setiap item harus begitu jelas worded bahwa semua siswa memahami tugas. Apakah murid harus menjawab dengan benar hanya ditentukan oleh apakah mereka memiliki pengetahuan atau pemahaman yang diukur.
4.      Apakah bebas dari bertele-tele berlebihan ? Ketika meninjau soal, isi dari setiap soal harus dianalisis untuk menentukan unsur-unsur fungsional yang menizarah ke jawaban yang, tepat. Jika ada unsur-unsur yang dapat mengabalkan murid-murid secara keseluruhan dan tetap merespon dengan benar, mungkin harus disingkirkan.
5.      Apakah item memiliki kesulitan yang sesuai ? Jika item tes digunakan dalam suatu norma-referenced tes Namun, tingkat kesulitan 50 persen yang diinginkan. Seperti yang akan kita lihat nanti, tingkat kesulitan ini memberikan diskriminasi antara berprestasi tinggi dan rendah. Dalam meninjau item untuk'ujian, semua dapat kita lakukan adalah membuat penilaian terbaik kita tentang kesulitan item (kecuali item analisis data yang tersedia), mempertimbangkan sifat pengujian dan latar belakang pendidikan murid.
6.      Apakah soal yang dimiliki (dalam menjawab pertanyaan itu) disepakati oleh para ahli? Ini masalah dengan bahan faktual, yang biasanya dapat dinilai sebagai benar atau salah. Hal ini terutama masalah dengan pilihan tipe-soal yang meminta alasan terbaik, metode yang terbaik, penafsiran yang terbaik, atau apa pun, di mana penilaian ahli menentukan jawabannya. Jika ahli setuju pada jawaban terbaik, baik, tapi tidak termasuk item yang mengharuskan murid untuk mendukung pendapat seseorang.

7.      Apakah soal bebas dari kesalahan teknis dan tidak relevan dengan petunjuk? Yang perlu dipertimbangkan dalam mencari jalan keluar kesalahan teknis dan tidak relevan dengan petunjuk seperti disebutkan sebelumnya, sebuah petunjuk yang tidak relevan adalah setiap unsur yang memimpin untuk jawaban yang benar dan dengan demikian mencegah soal dari berfungsi sebagaimana dimaksud. Ini meliputi (1) gramatikal inkonsistensi. (2) asosiasi verbal, (3) penentu spesifik (yaitu kata-kata seperti selalu dan tidak pernah), dan (4) beberapa fitur mekanis, seperti pernyataan yang benar cenderung lebih panjang daripada yang salah.

8.      Apakah item bebas dari ras, etnis, dan bias seksual? Sebuah pemeriksaan terakhir harus dilakukan untuk memastikan bahwa masalah kosakata dan situasi di setiap soal akan dapat diterima oleh semua anggota kelompok dan akan mempunyai makna yang sama kepada mereka.
Ketika tes item telah direvisi dan orang-orang untuk dimasukkan dalam ujian, ragu-ragu telah dipilih, pertanyaan-pertanyaan berikut harus diminta :
1.      Apakah item tes mengukur sampel yang representatif dari, hasil pembelaiaran dan isi kursus termasuk dalam rencana uji?
2.      Apakah ada cukup banyak item tes untuk setiap interpretasi yang harus dibuat?
3.      Apakah kesulitan item pengujian yang sesuai untuk tujuan pengujian bagi murid untuk tes yang dimaksudkan?
4.      Apakah item tes bebas dari tumpang tindih sehingga informasi di sate tidak memberikan petunjuk untuk jawaban lain?
Pertanyaan pertama dapat dijawab dengan membandingkan pemilihan firial item dengan tabel spesifikasi atau rencana tes lainnya. Jawaban ke tiga terakhir ditentukan dengan meninjau item pengujian dalam setiap bagian dari ujian dan tes secara keseluruhan. Jawaban afirmatif untuk pertanyaan-pertanyaan ini berarti barang siap untuk disusun dalam bentuk ujian akhir.


Mengatur Produk di Test  ( Arranging Item in the Test )
Ada berbagai metode pengelompokan item dalam tes prestasi, dan metode akan agak berbeda dengan penggunaan dibuat dari hasil. Bagi sebagian besar tujuan kelas, barang-barang dapat diatur oleh pertimbangan sistematis (1) jenis-jenis item yang digunakan; (2) mengukur hasil pembelajaran, (3) kesulitan yang item, dan (4) subjek yang diukur.
Pertama dan terutama, soal harus diatur dalam berbagai jenis soal. Artinya, semua soal yang benar-salah harus dikelompokkan bersama-sama, maka semua item yang cocok, semua item pilihan ganda, dan sebagainya. Pengaturan ini memerlukan paling sedikit set arah, agar mudah bagi murid-murid karena mereka dapat memiliki mental yang sama setiap seluruh bagian dan itu sangat memudahkan skor. Ketika dua atau lebih soal jenis dimasukkan dalam ujian, ada juga beberapa keuntungan dalam menjaga jenis soal yang lebih sederhana bersama-sama dan menempatkan yang lebih kompleks dalam ujian, sebagai berikut:
1.    Benar-salah atau respons alternatif soal
2.    Pencocokan soal
3.    Jawaban pendek soal
4.    Soal pilihan ganda.
5.    Interpretatif latihan.
6.    Pertanyaan esai.
Mengatur bagian dari uji dalam urutan ini menghasilkan sebuah urutan yang kira-kira mendekati kompleksitas hasil pembelajaran diukur, mulai dari yang sederhana sampai yang kompleks. Hal ini kemudian hanya masalah pengelompokan soal dalam masing-masing jenis item. Untuk tujuan ini, item yang mengukur hasil yang serupa harus ditempatkan bersama-sama dan kemudian disusun dalam urutan menarik kesulitan. Sebagai contoh, soal di bagian pilihan ganda mungkin diatur sebagai berikut: (1) pengetahuan tentang istilah, (2) pengetahuan tentang fakta-fakta yang
spesifik, (3) pengetahuan tentang prinsip-prinsip, dan (4) penerapan prinsip­-prinsip. Menjaga bersama-sama soal yang mengukur hasil serupa sangat membantu dalam menentukan jenis hasil pembelajaran murid menyebabkan kesulitan terbesar.

Menilai Pengujian Kelas (Appraising Classroom Tests )
Sebelum tes kelas dikelola, seharusnya-dievaluasi sesuai dengan poin yang telah dibahas sebelumnya. Sebuah tanggapan untuk setiap pertanyaan ini menunjukkan bahwa tes siap, dan sudah dengan hati-hati mungkin akan berfungsi efektif.
Setelah tes kelas telah mencetak gol dan murid telah membahas hasil, praktik yang umum adalah untuk membuang ujian. Kecuali untuk murid-murid 'kritik dalam diskusi kelas, yang membantu mengidentifikasi sonik dari item yang rusak, guru hanya memiliki sedikit bukti mengenai kualitas tes yang digunakan. Pada penjumlahan, dengan membuang ujian, banyak perencanaan yang hati-hati dan kerja keras yang menangis dalam  persiapan yang terbuang. Sebuah prosedur  lebih baik untuk menilai efektivitas soal  pengujian dan membangun file berkualitas tinggi item untuk penggunaan masa depan.

Soal Menentukan Efektivitas  (Determining Item Effectivesness)
Efektivitas setiap soal tes dapat ditentukan dengan menganalisis murid-murid 'tanggapan untuk itu. Analisis item ini biasanya didesain untuk menjawab pertanyaan­pertanyaan seperti berikut:
A. Kecukupan Rencana Tes (Adequacy ot Test Plan)
1.      Apakah rencana uji cukup menggambarkan tujuan instruksional dan konten diukur?
2.      Apakah rencana uji dengan jelas menunjukkan penekanan relatif akan diberikan kepada masing-masing tujuan dan konten setiap daerah?
B. Kecukupan jenis tes (Adequacy of Test Item)
3.      adalah format dari setiap item yang sesuai untuk hasil belajar yang diukur?
4.      Apakah item tes mengharuskan murid untuk menunjukkan kinerja yang dijelaskan dalam hasil belajar khusus untuk mengukur (relevansi)?
5.      Apakah setiap tes ada item yang jelas dan pasti tugas yang harus dilakukan (kejelasan)?
6.      Apakah tes item yang disajikan dalam sederhana, bahasa yang dapat dibaca dan bebas dari berlebihan (keringkasan yg padat isinya)?
7.      Apakah item tes kesulitan yang sesuai untuk jenis tes dibangun (ideal kesulitan)?
8.      Apakah tes masing-masing item memiliki jawaban yang akan disepakati oleh para ahli (kebenaran)
9.      Apakah masing-masing item tes bebas dari kesalahan teknis dan tidak relevan petunjuk (teknis kesehatan)?
10.  Apakah masing-masing item tes bebas dari ras, etnis, dan bias seksual (budaya keadilan)?
11.  Apakah masing-masing item tes independen dari item lain dalam ujian?
12.  Apakah ada jumlah yang memadai untuk masing-masing item tes hasil belajar. (Contoh kecukupan) ?

C. Kecukupan Uji Format dan Arah (Adequaci of Test Format)
13.  Apakah soal tes dari jenis yang sama dikelompokkan bersama dalam ujian (atau dalam bagian tes)?
14.  Apakah soal tes disusun dari mudah untuk lebih sulit dalam bagian dari Uji dan tes secara keseluruhan?
15.  Apaka soal tes bernomor secara berurutan?
16.  Apakah ruang jawaban dengan jelas menunjukkan (pada tes itu sendiri atau pada jawaban yang terpisah lembar), dan adalah, masing-masing ruang jawaban yang berkaitan dengan pengujian yang sesuai item?
17.  Apakah jawaban yang benar didistribusikan sedemikian rupa sehingga tidak ada terdeteksi pola?
18.  Apakah materi ujian baik spasi, tanda baca, dan bebas dari kesalahan ketik?
19.  Apakah ada petunjuk untuk setiap bagian dari ujian dan tes secara keseluruhan?
20.  Apakah petunjuk yang jelas dan ringkas?
1. Apakah fungsi soal yang dimaksudkan?
a.       Apakah soal tes secara memadai membedakan antara yang berprestasi tinggi dan rendah?
b.      Apakah kriteria soal tes direferensikan secara memadai mengukur dampak dari instruksi?
2. Apakah soal tes memiliki tingkat kesulitan yang sesuai?
3. Apakah soal tes bebas dari petunjuk yang tidak relevan dan cacat lainnya?
4. Apakah setiap distracters efektif (dalam soal pilihan ganda) ?
Manfaat dari analisis item tidak terbatas pada perbaikan item tes individu, namun. Ada sejumlah tunjangan nilai khusus untuk kelas guru. Yang paling penting di antaranya adalah sebagai berikut:
1.     Item  data analisis menyediakan dasar untuk diskusi kelas efisien tentang   
     hasil tes.
Mengetahui bagaimana setiap item berfungsi secara efektif dalam mengukur pencapaian memungkinkan untuk membatasi diskusi untuk bidang-bidang paling membantu murid. Item yang mudah dijawab dengan benar oleh semua murid dapat dihilangkan dari diskusi, dan konsep item-item yang menyebabkan siswa kesulitan terbesar dapat mene'rima penekanan khusus. Demikian pula, kesalahan informasi dan kesalahpahaman tercermin dalam pilihan distracters tertentu dapat diperbaiki. Analisis konten juga akan mengekspos cacat teknis pada butir soal. Selama diskusi, cacat barang yang bisa ditunjukkan kepada murid, menghemat banyak «aktu dan dipanaskan ketidakadilan diskusi panas mengenai soal ini. Jika soal ambigu dan dua jawaban dapat dipertahankan sama baiknya, jawaban baik harus dihitung benar dan penilaian disesuaikan.
2.    Item data analisis menyediakan dasar untuk perbaikan kerja.
Meskipun membahas hasil tes di kelas dapat memperjelas dan benar banyak titik-titik tertentu, analisis soal yang sering membawa untuk menerangi area umum kelemahan yang memerlukan perhatian lebih serius. Dalam sebuah tes berhitung, misalnya, analisis soal yang dapat mengungkapkan bahwa siswa cukup mahir dalam keterampilan aritmatika tetapi mengalami kesulitan dengan masalah-masalah yang membutuhkan penerapan keterampilan ini. Mata pelajaran lain, analisis item umum mungkin menunjukkan kelemahan dalam pengetahuan kosakata teknis, dalam pemahaman prinsip-prinsip, atau dalam kemampuan untuk menafsirkan data. Informasi memungkinkan perbaikan fokus bekerja secara langsung minyak daerah tertentu kelemahan.
3.    Soal analisis  data yang menyediakan dasar untuk perbaikan umum kelas
     instruksi.
4.    Selain menggunakan data sebelumnya, soal analisis data dapat membantu
     dalam   mengevaluasi kelayakan hasil pembelajaran dan isi kursus untuk   
      murid tertentu yang diajarkan.
    Misalnya, materi yang secara konsisten Apakah terlalu sederhana atau terlalu sulit
    untuk murid-murid, kurikulum mungkin disarankan revisi atau pergeseran dalam
    penekanan pengajaran.
5.    Soal prosedur analisis menyediakan dasar meningkat mengisi tes    
     keterampilan konstruksi.
Menunjukkan ambiguitas analisis soal, petunjuk, dan cacat teknis lainnya yang tidak terjawab selama persiapan ujian. Informasi ini digunakan secara langsung dalam merevisi soal tes untuk penggunaan masa depan. Selain perbaikan item tertentu, bagaimanapun kami memperoleh manfaat dari prosedur itu sendiri. Saat kami menganalisa murid 'tanggapan ke item, kita menjadi semakin sadar tentang kerusakan teknis dan apa mereka yang menyebabkannya. Ketika merevisi soal, kita memperoleh pengalaman dalam pernyataan rewording sehingga mereka jelas, distracters menulis ulang sehingga mereka lebih masuk akal, dan memodifikasi soal sehingga mereka berada pada tingkat kesulitan yang lebih tepat. Sebagai akibatnya, tes umum kita akan meningkatkan keterampilan konstruksi. Berurusan dalam mempersiapkan rencana penilaian dan membangun soal tes yang relevan dan penilaian tugas-tugas harus diikuti dengan berurusan serupa dalam meninjau dan mengedit soal dan tugas, mempersiapkan arah yang jelas, mengelola dan menilai hasil. Perhatian terhadap isu-isu ini akan pergi jauh dalam tes untuk mengurangi kesalahan dan meningkatkan kehandalan.

Analisis Prosedur Soal Sederhana untuk Rujukan Norma Kelas Pengujian
Karena norma-referenced dan kriteria-referenced tes melayani fungsi yang berbeda, metode untuk menganalisis efektivitas item pengujian berbeda. Di sini kita akan membahas prosedur soal analisis yang digunakan dengan norma-referenced tes. di mana  penekanan khusus ditempatkan pada soal-soal diskriminatif kesulitan dan kekuasaan. Sebuah diskusi tentang item-prosedur analisis yang digunakan dengan kriteria-referenced akan mengikuti tes keahlian pada bagian selanjutnya.
Bagi kebanyakan norma-referenced tes kelas, bentuk yang disederhanakan analisis soal adalah segala sesuatu yang diperlukan atau diperlukan. Karena sebagian besar kelompok kelas di suatu tempat antara 20 dan 40 murid, prosedur yang sangat berguna adalah membandingkan to tanggapan dari 10 siswa dengan skor tertinggi tanggapan dari 10 skor terendah murid. Seperti yang akan kita lihat nanti, menjaga atas dan kelompok rendah pada 10 murid setiap menyederhanakan interpretasi hasil. Hal ini juga merupakan jumlah yang wajar untuk analisis dalam kelompok-kelompok yang mengandung antara 20 dan 40 murid dan Sebagai contoh, dengan kelompok kelas kecil, seperti bahwa dari 20 siswa, yang terbaik adalah untuk menggunakan bagian atas dan bawah untuk mendapatkan data yang diandalkan, sedangkan dengan kelompok yang lebih besar, seperti yang dari 40 murid, penggunaan atas dan bawah 25 persen adalah quire memuaskan.
Untuk mengilustrasikan metode analisis soal, mari kita anggap bahwa kita baru saja selesai mencetak tes 32 makalah untuk kelas enam unit ilmu "cuaca." Pada analisis soal mungkin kemudian lanjutkan sebagai berikut:
1.    Peringkat 32 agar kertas tes dari tertinggi ke skor terendah.
2.    Memilih 10 makalah dengan total skor tertinggi dan 10 kertas dengan total skor terendah.
3.      Menyisihkan 12 tengah kertas karena mereka tidak akan digunakan dalam analisis.
4.    Untuk setiap tes item, tabulasi jumlah murid di atas dan bawah masing-masing kelompok yang memilih altematif. Tabulasi ini dapat dibuat langsung pada kertas tes atau pada kartu item pengujian, seperti yang ditunjukkan pada Gambar 10.2.
5.      Hitunglah item kesulitan masing-masing. (Persentase murid yang mendapat item kanan).
6.      Hitunglah kekuatan membedakan setiap item (perbedaan antara jumlah murid dalam kelompok atas dan bawah yang mendapat item kanan.
7.      Mengevaluasi efektivitas dalam setiap item distracters (days tarik alternatif yang salah).
Langkah pertama prosedur ini hanya merupakan tabulasi yang nyaman murid 'tanggapan dari yang kita dapat dengan mudah menentukan kesulitan item, item membedakan kekuasaan, dan efektivitas setiap Distracter.  Informasi terakhir ini seringkali bisa diperoleh hanya dengan memeriksa item-analisis data. Catatan pada
Gambar 10.2, misalnya, bahwa 10 murid dalam kelompok atas dan 4 murid dalam kelompok yang lebih rendah dipilih alternatif yang benar (B). Hal ini membuat total 14 dari 20 murid yang mendapat barang yang benar, yang menunjukkan bahwa item memiliki nilai cukup rendah ", tingkat kesulitan. Karma lebih murid dalam kelompok atas daripada di kelompok yang lebih rendah mendapatkan item benar, itu adalah membedakan positif. Maksudnya, itu adalah membedakan antara tinggi dan berprestasi rendah (sebagaimana ditentukan oleh total nilai ujian). Akhirnya, karena semua alternatif yang dipilih oleh beberapa murid dalam kelompok yang lebih rendah, yang distracters (Alternatif A, C dan D) akan muncul untuk beroperasi secara efektif Meskipun analisis item dengan pemeriksaan akan mengungkapkan efektivitas umum item tes dan memuaskan untuk sebagian benar tujuan kelas. kadang-kadang berguna untuk mendapatkan perkiraan yang lebih tepat item kesulitan dan kekuasaan diskriminatif Ini dapat dilakukan dengan menerapkan formula relatif sederhana ke item-analisis data.
Kesulitan Item komputasi. Kesulitan tes item ditunjukkan dengan persentase murid rang mendapat barang yang benar maka kita dapat menghitung item yang kesulitan dengan menggunakan rumus benik-ut, di mama R = jumlah murid yang mendapat kanan item dan T = jumlah murid yang mencoba item.
R
Item Kesulitan T x 100
Menerapkan rumus ini untuk item-analisis data pada Gambar 10.2. Indeks kami kesulitan (P) adalah 70 persen, sebagai berikut:
P = 14 X 100 = 70 persen
Item komputasi kesulitan dari item data analisis, perhitungan kami didasarkan pada kelompok atas dan bawah saja. Kami berasumsi bahwa tanggapan dari murid di kelompok tengah pada dasarnya mengikuti pola yang sama. Perkiraan kesulitan ini cukup akurat untuk penggunaan di dalam kelas dan mudah diperoleh, karena angka­angka yang dibutuhkan dapat diambil langsung dari item-analisis data. Perhatikan bahwa karena item kita analisis didasarkan pada 10 di kelompok atas dan 10 dalam kelompok yang lebih rendah, semua kita perlu lakukan untuk mendapatkan kesulitan item adalah untuk membagi jumlah benar mendapatkan oleh 2 (14 -. 2 = 7), bergerak titik desimal satu ke kanan (70), dan menambahkan tanda persen (70%). Dengan kata lain, 14 dari 20 adalah sama dengan 7 dari 10, yang adalah 70 persen. Jika 13 murid itu untuk mendapatkan item yang benar, item akan kesulitan 6,5 dari 10 (13 - 2 = 6.5), atau 65  persen. Hal ini mungkin terlihat sedikit membingungkan pada awalnya, tetapi sekali Anda memahami ide, Anda dapat mental item kesulitan menghitung dengan sangat cepat. Seperti dicatat sebelumnya, kemudahan konten menafsirkan statistik adalah salah satu keuntungan menggunakan 10 dalam setiap kelompok. Jika lebih dari 10 yang digunakan (atau kurang), formula untuk item komputasi kesulitan bisa, tentu saja, masih dapat digunakan, tetapi jauh lebih sulit untuk menghitung hasil mental.
Komputasi item Membedakan Power.
Soal mendiskriminasikan arah yang positif jika lebih murid lebih dalam kelompok atas daripada kelompok yang lebih rendah mendapatkan soal kanan. Diskriminasi positif menunjukkan bahwa soal tersebut diskriminatif dalam arah yang sama dengan total nilai ujian. Karena kita berasumsi bahwa total nilai ujian mencerminkan pencapaian tujuan yang diinginkan, kami ingin semua item pengujian menunjukkan diskriminasi positif.

Kekuatan yang membedakan  soal tes prestasi  mengacu pada derajat. Yang membedakan antara siswa dengan prestasi tinggi dan rendah. Membedakan soal kekuasaan yang diperoleh dengan mengurangkan jumlah murid dalam kelompok yang lebih rendah mendapatkan item kanan (RL) dari jumlah murid dalam kelompok atas yang mendapatkan item kanan (Ru) dan membaginya dengan setengah dari jumlah murid dimasukkan dalam analisis item (1/2T). Diringkas dalam bentuk formula, maka
Item Membedakan Power = Ru-R1
1/2 T

Menerapkan rumus ini ke item-analisis data pada Gambar 10.2, kita memperoleh­suatu indeks daya diskriminatif (D) dari, 60, sebagai berikut:
D = 10-4  = 60
10
Ini menunjukkan rata-rata sekitar kekuasaan diskriminatif Item dengan diskriminatif positif maksimum daya adalah salah satu di mane semua murid dalam kelompok atas mendapatkan item kanan dan semua murid dalam kelompok yang lebih rendah mendapatkan item salah. Hal ini menyebabkan indeks 1,00, sebagai berikut:
D = 10-0 = 1,00
         10
Item yang tidak memiliki kekuatan diskriminatif di mana jumlah yang sama murid baik di atas dan kelompok bawah mendapatkan item kanan. Hal ini menyebabkan indeks, 00, sebagai berikut:
D = 10-0 =.00
                       10
Mengevaluasi Efektivitas Distracters. Seberapa baik setiap Distracter adalah dapat ditentukan dengan pemeriksaan, sehingga tidak perlu untuk menghitung efektivitas suatu indeks, meskipun formula untuk membedakan kekuasaan dapat digunakan untuk tujuan ini. Secara umum, Distracter yang baik menarik lebih banyak murid-murid dari kelompok yang lebih rendah daripada kelompok atas. Dengan demikian, harus membedakan antara kelompok atas dan bawah dengan cara yang berlawanan dengan alternatif yang tepat. Pemeriksaan barang berikut analisis data yang akan menggambarkan kemudahan yang efektivitas panggilan distracters ditentukan oleh inspeksi.
Alternatif A adalah jawaban yang benar.
Alternatif
*A
B
C
D
Omits
Upper 10
5
4
0
1
0
Lower 10
3
2
0
5
0
* Jawaban yang benar
Pertama perhatikan bahwa item mendiskriminasikan arch yang positif, karena 5 dalam dan 3 dalam kelompok yang lebih rendah mendapatkan item kanan. Indeks discriminasi cukup rendah (D = 20), bagaimanapun, dan ini mungkin sebagian disebabkan oleh ketidak efektifan dari beberapa distracters. Alternatif B adalah Distracter miskin karena menarik lebih banyak murid dari kelompok atas daripada dari kelompok yang lebih rendah. Hal ini kemungkinan besar karena beberapa ambiguitas dalam pernyataan item tersebut. Alternatif C benar-benar tidak efektif sebagai Distracter karena tidak ada yang tertarik. Alternatif D berfungsi sebagaimana dimaksud, karena menarik proporsi yang lebih besar murid dari kelompok yang lebih rendah. Dengan demikian, kekuatan yang membedakan produk ini mungkin dapat ditingkatkan dengan menghilangkan ambiguitas dalam laporan item dan merevisi atau mengganti Alternatif B dan C. perubahan tertentu harus, tentu saja, didasarkan pada tes pemeriksaan barang itu sendiri. Item-data analisis hanya menunjukkan kurang berfungsinya item, bukan penyebab berfungsi miskin.
Item-analisis perekaman data kertas test.
Ada beberapa keuntungan dalam item-analisis rekaman data secara langsung pada kertas tes yang digunakan sebagai kunci penilaian. Dalam  meninjau kembali hasil tes dengan murid, misalnya, data pada bantuan kunci dalam menentukan berapa banyak diskusi untuk mengabdikan untuk item tertentu jenis mungkin kesalahpahaman  murid (oleh distracters dipilih), yang begitu cacat sehingga mereka mungkin akan diabaikan. Jika atas (U) dan lebih rendah (L) kelompok masing-masing mengandung 10 murid, seperti dalam ilustrasi kami kesulitan dan soal-soal diskriminatif mental kekuasaan dapat dihitung mengikuti langkah-langkah  yang disarankan sebelumnya. Sebagai contoh, untuk item dalam Gambar 10.3, mental dan hasil perhitungan adalah sebagai berikut:



Gambar 10.3
UNIT CUACA

Nama .............................................................. Tanggal ................................................
Arah. Tes ini akan mengukur apa yang telah Anda pelajari selama unit pada cuaca. Ada 40 pertanyaan objektif dalam ujian. Anda akan memiliki seluruh kelas periode untuk menyelesaikannya   Untuk setiap pertanyaan ada beberapa kemungkinan jawaban. Pilih jawaban terbaik dan menunjukkan dengan melingkari huruf jawaban Anda.
Skor Anda akan jumlah pertanyaan yang dijawab dengan benar, jadi pastikan untuk. menjawab setiap pertanyaan.
PENGETAHUAN FAKTA
U
L
1. Mana dari instrumen ini digunakan untuk mengukur kelembaban?
0
1
A. Anemometer
0
1
B. Barometer
10
8
C. Hygrometer
0
0
D. Thermometer



U
L
2. Apa menunjukkan skala Beaufort pada peta cuaca
1
2
A. Tekanan Udara
0
1
B. Suhu Udara
0
1
C. Air Hujan
9
6
D. Kecepatan Angin

Item sulit






Langkah (menggunakan angka di kiri jawaban)         Item 1                    Item 2

1. Tambahkan U + Li dan bagi dengan 2)                  18 -.2 = 9               15 - 2 = 7.5

2. Pindahkan titik desimal satu ke kanan
90

75

3. Tambahkan tanda persen
90 %

75 %

Diskriminasi Item Indeks




Langkah (menggunakan angka di kiri jawaban)
Item 1

Item 2

1. Kurangi U-L
10-8 =
2
9– 6=
3
2. Pindahkan desimal koma satu ke kiri
2

3

3. Tambahkan nol setelah nomor
20

30


Seperti disebutkan sebelumnya, sekali metode sederhana ini mental menghitung dua indeks adalah menguasai, tidak ada tertulis komputasi yang diperlukan. Selama diskusi tentang hasil pengujian, Anda dapat dengan cepat menilai diskriminatif kesulitan dan kekuatan dari setiap item. Selain itu, tentu saja, inspeksi visual akan mengungkapkan efektivitas setiap Distracter. Sekilas pada item dalam Gambar 10.3, misalnya, menunjukkan Alternatif  D dalam ayat 1 tidak efektif  Rupanya "termometer" terlalu baik dikenal untuk melayani sebagai Distracter yang baik dalam item ini.
Memperingatkan dalam Interpreting Item-Analisis Data Norm-Referenced Test
Analisis item yang cepat adalah teknik sederhana dengan untuk menilai efektivitas masing-masing item tes. Informasi dari analisis seperti terbatas dalam banyak hal, bagaimanapun, dan harus ditafsirkan sesuai. Berikut ini adalah beberapa peringatan utama untuk mengamati:
1. Daya membedakan soal tidak selalu menunjukkan validitas soal. Dalam deskripsi item kami analisis, kami menggunakan total skor tes sebagai dasar untuk memilih kelompok atas (berprestasi tinggi) dan kelompok rendah (low prestasi) prosedur yang paling umum, karena ukuran yang sebanding untuk mencapai pengukuran biasanya tidak tersedia. Idealnya, kami akan memeriksa tes masing­masing item dalam rotasi untuk beberapa ukuran pencapaian independen. Namun, ukuran terbaik dari prestasi tertentu kita tertarik dalam mengevaluasi biasanya total skor pada uji prestasi kita telah membangun, karena masing-masing kelas tes adalah terkait dengan tujuan instruksional tertentu dan konten saja. Bahkan tes standar di bidang konten yang sama biasanya tidak memadai sebagai kriteria yang tergantung,
karena mereka lebih ditujukan pada tujuan umum daripada yang diukur dengan tes kelas kursus tertentu.
Menggunakan total skor dari tes kelas sebagai dasar untuk memilih berprestasi tinggi dan rendah adalah sah selama kita ingat bahwa kita menggunakan internal kriteria. Dalam melakukannya ditawarkan analisis barang bukti mengenai konsistensi internal dari ketimbang tes validitas. Artinya, kita menentukan bagaimana masing-masing item tes efektif mengukur, apa pun seluruh tes pengukuran. Seperti item-analisis data dapat ditafsirkan sebagai bukti validitas item hanya ketika validitas dari tes total telah terbukti atau dapat sah diasumsikan.

2. Analisis item oleh Komputer
Sekarang banyak sekolah yang mempunyai komputer yang dapat dengan baik menganalisis skor tes. Hasil cetakan komputer akan memberikan analisis item-informasi, koefisien kehandalan, standard error pengukuran, dan berbagai jenis informasi mengenai kinerja individu diuji dan karakteristik dari tes. Sifat informasi tergantung pada kecanggihan komputer dan program yang digunakan.
Ketika analisis barang dilakukan oleh komputer, nilai dari seluruh kelompok ini biasanya digunakan bukan sekadar nilai dari. kelompok atas dan bawah. total skor mungkin akan dibagi menjadi dua, tiga, empat, atau lima tingkat, tergantung pada ukuran kelompok dan jenis analisis. Item-analisis data pada komputer berbasis print out pada 50 murid yang mungkin muncul sebagai berikut, untuk setiap item:
Pola Respon item
ITEM 1                      A      B     C       D      E        OMT     TOTAL     ITEM
                                                                                                                Statistics
Atas 30 %                  1       1      12      1       0        0            15              Susah 60 %
Tengah 40 %              2       2      12      3       1        0            20              Discriminasi 40
Bawah 30 %              2       3      6        3       1        0            15
Total                          5       6      3        0       7        2 0         50

Respons item-data yang menunjukkan berapa banyak murid, pada setiap tingkat, memilih jawaban yang benar (C) dan berapa banyak dipilih masing-masing distracters. Statistik item di sebelah kanan menunjukkan indeks kesulitan dan indeks dari diskriminasi untuk item ini. Beberapa program komputer hanya melaporkan statistik item, tapi item-pola respons yang sangat berharga untuk mengevaluasi efektivitas dan perencanaan distracters bulu item revisi. Alternatif E, misalnya, harus diperiksa untuk menentukan apakah itu bisa diganti dengan yang lebih efektif Distracter.
2. Indeks rendah kekuasaan diskriminatif tidak selalu menunjukkan suatu cacat yang buruk membedakan antara yang bemr?stasi tinggi dan rendah harus diperiksa Ahtuk kemungkinan adanya ambiguitas, Clues, dan cacat teknis lainnya. Jika tidak ada yang ditemukan dan mengukur barang- barang hasil pembelajaran penting. mereka harus berbohong dipertahankan untuk penggunaan mass depan. Setiap, barang yang mendiskriminasikan arch yang positif dapat berkontribusi untuk mengukur pencapaian murid, dan indeks rendah diskriminasi sering diperoleh untuk alasan lain selain teknis cacat.
Faktor lain yang mempengaruhi daya diskriminatif adalah kesulitan dari item. Item-item pada tingkat 50 persen kesulitan memaksimalkan kekuatan nating discrimi, karena hanya pada tingkat kesulitan ini dapat semua murid di bagian atas kelompok mendapatkan barang yang tepat, dan semua murid di bagian bawah salah mengerti. ' Ketika kita bergerak menjauh dari 50 persen terhadap tingkat kesulitan lebih mudah atau''Iebih sulit itd'm, indeks dari kekuasaan diskriminatif menjadi lebih kecil. Dengan demikian, barang yang sangat mudah atau sangat sulit memiliki indeks rendah kekuasaan diskriminatif Kadang-kadang perlu atau diinginkan untuk mempertahankan barang-barang seperti itu, bagaimanapun, dalam rangka untuk mengukur sampel yang representatif hasil pembelajaran dan isi kursus.
Untuk meringkas, indeks rendah daya membedakan kita harus waspada kemungkinan adanya cacat teknis dalam pengujian barang, tetapi tidak boleh menyebabkan kita membuang barang berharga yang sebenarnya. Dibangun dengan baik tes prestasi, kebutuhan, berisi item dengan daya membedakan rendah, dan untuk membuang mereka akan menghasilkan tes yang kurang daripada lebih valid.
3. Item-analisa data dari sampel keen sangat tentatif.
Item prosedur analisis fokus perhatian kami secara langsung pada item tes kesulitan dan diskriminasi kekuatan yang kita sering disesatkan untuk percaya bahwa ini adalah tetap, tidak berubah, karakteristik. Hal ini, tentu saja, adalah-tidak benar. Item-analisis data akan berbeda-beda dari sate kelompok ke kelompok lain, tergantung tingkat kemampuan, latar belakang pendidikan mereka, dan jenis instruksi yang murid-murid miliki.
Sifat tentatif analisis item-data harus mencegah kita dari membuat perbedaan hales antara item berdasarkan indeks kesulitan dan kekuasaan diskriminatif Jika item diskriminatif dalam arch yang positif, semua alternatif yang berfungsi secara efektif, dan tidak memiliki cacat jelas, dianggap dapat memuaskan dari segi teknis~ Pertanyaan penting kemudian menjadi tidak seberapa ting indeks dari kekuasaan Pa diskriminatif, tetapi, apakah ukuran item, yang pentinehasil belajar. Dalam analisis akhir, nilai dari sebuah item tes prestasi harus didasarkan pada statistik logis bukan pertimbangan.
Ketika digunakan dengan rujukan norms tes kelas, analisis item memberikan kita dengan penilaian umum dari efektivitas fungsional item pengujian. alas untuk mendeteksi cacat, dan metode pengajaran untuk mengidentifikasi kelemahan. Untuk tujuan ini, sifat tentatif analisis item-data yang relatif tidak penting. Ketika kami mencatat indeks item kesulitan atau daya diskriminasi kartu item untuk penggunaan berikutnya, kita harus menafsirkan mereka sebagai perkiraan kasar saja. Dengan demikian, mereka masih lebih unggul dari perkiraan tanpa bantuan akan mengalami kesulitan dan diskriminatif dari item kekuasaan.
Item-Analisis dan Kriteria Rujukan Tes Penguasaan
Item-prosedur analisis yang digunakan dengan norma-referenced tes tidak langsung diterapkan pada kriteria-referenced tes keahlian. Karena kriteria-referenced tes dirancang untuk menggambarkan murid dalam hal jenis tugas-tugas belajar yang) bisa melakukan, bukan untuk mendapatkan peringkat yang dapat diandalkan murid, indeks kesulitan item dan item kekuasaan diskriminatif kurang bermakna.
Kesulitan item.
Tingkat yang dikehendaki item kesulitan untuk kriteria-referenced tes penguasaan tidak didasarkan pada item kemampuan untuk membedakan antara tinggi dan berprestasi rendah, seperti bagi norma-referenced tes. Sebaliknya, kesulitan masing-masing item tes ditentukan oleh hasil pembelajaran yang dirancang untuk mengukur. Rumus standar untuk menentukan item yang kesulitan dapat diterapkan untuk tes direferensikan kriteria-item, tetapi hasilnya biasanya tidak digunakan untuk memilih item tes atau untuk memanipulasi item kesulitan. Kebanyakan item pada kriteria-referenced tes penguasaan akan memiliki indeks kesulitan besar (tingginya persentase kelulusan) ketika instruksi telah efektif
Item Membedakan kemampuan.
Kemampuan item tes untuk membedakan antara yang berprestasi tinggi dan rendah tidak penting untuk mengevaluasi efektivitas direferensikan kriteria-item tes. Beberapa item terbaik mungkin sangat rendah, atau nol, indeks diskriminasi. Jika semua murid menjawab item tes dengan benar (yaitu, diskriminasi nol) pada akhir pengajaran, misalnya, ini mungkin menunjukkan bahwa balk instruksi dan item telah efektif Walaupun barang-barang tersebut akan dihilangkan dari norms-referenced tes karena mereka gagal discrimin. Karena tujuan dari sebuah kriteria-referenced tes ini adalah untuk menggambarkan spa yang dapat dilakukan siswa, bukan untuk membedakan di antara mereka, kami indeks tradisional kekuasaan diskriminatif nilai kecil untuk menilai item pengujian mutu.
Analisis Kriteria-Referenced Penguasaan Produk.
Sebuah pertanyaan penting kriteria-referenced. Penguasaan tes adalah "Sejauh manakah item tes mengukur dampak dari instruksi?" Untuk menjawab ini, pengujian yang sama harus diberikan sebelum instruksi (pretest) dan setelah instruksi (posttest) dan hasilnya dibandingkan. Item sederhana-by-item perbandingan dapat dibuat dengan cars-respons item diagram.
Untuk mempersiapkan sebuah grafik seperti Tabel 10.2, cukup daftar jumlah item pengujian di bagian atas tabel dan nama-nama murid di sisi grafik, dan kemudian mencatat yang benar (+) dan salah (-) tanggapan untuk setiap murid di yang pretest (B) dan posttest (A). Hasil dalam tabel contoh kami telah menyimpang deliberately sonik untuk menggambarkan pola dasar item respons. Analisis efektivitas setiap item sebagai ukuran efek instruksional adalah sebagai berikut:
.
Item I  Ini adalah item yang ideal untuk sebuah kriteria-referenced tes penguasaan. Semua murid                
             menjawab benar sebelum instruksi  dan benar setelah instruksi. Balk item dan instruksi yang
             efektif
Item 2 Item ini terlalu mudah untuk mengukur dampak pengajaran, karena semua
  murid menjawab dengan benar baik sebelum dan sesudah instruksi.
Item 3 Item ini terlalu sulit untuk mengukur dampak pengajaran, atau instruksi
  yang tepat.
Item 4 Item ini menunjukkan cacat yang sangat item atau barang yang mudah
  diikuti oleh salah instruksi.
Item 5 Item ini menggambarkan item yang efektif, dengan respon yang cukup khas
  pola. Beberapa murid menjawab dengan benar sebelum instruksi, tapi
  proporsi yang lebih besar melakukannya setelah instruksi.
Di mana indeks efektivitas item yang diinginkan untuk setiap item, rumus berikut ini
dapat digunakan untuk mendapatkan ukuran kepekaan terhadap Efek Intruksional  
 S=RA - RB
T
di mana
RA = jumlah murid yang mendapat hak item setelah instruksi.
R.B = jumlah murid yang mendapat item tepat sebelum instruksi.
T = total jumlah murid yang mencoba item kedua kali.
Menerapkan formula ini untuk pengujian lima item.
Item 1
S =
6
– 0
=
1.00
(Ideal)



6



Item 2
S =
6
– 6
=
.00
(terlalu mudah)



6



Item 3 :
S =
0
– 0
=
.00
(terlalu susah)



6



Item 4 :
S =
0
– 6
=
1.00
(tidak ideal)



6



Item 5 :
S =
5
– 2
=
.50
(efektif)



6




Dengan demikian, item yang ideal untuk sebuah kriteria-referenced tes penguasaan menghasilkan nilai 1,00 Efektif item jatuh di antara 00 dan 1,00, dan semakin tinggi nilai positif, yang lebih sensitif akan item untuk efek instruksional. Item dengan nilai negatif nol dan tidak mencerminkan efek dimaksudkan instruksi. Karena nilai-nilai efektif digunakan untuk mewakili kriteria-referenced tes item (,00­1,00) adalah sama seperti yang digunakan untuk mewakili daya diskriminasi item, harus berhati-hati untuk tidak membingungkan arti dari dua indeks. Tradisional yang diskriminatif dari kekuasaan (D) menunjukkan sejauh mana suatu item membedakan antara yang berprestasi tinggi dan rendah pada satu tes administrasi, dan indeks sensitivitas terhadap efek instruksional (S) menunjukkan sejauh mana suatu item mencerminkan efek dimaksud instruksi.
Efektivitas Distracters.
Apakah fungsi masing-masing alternatif dalam item pilihan ganda juga penting dalam kriteria-referenced tes. Idealnya, murid harus memilih salah satu alternatif yang salah jika mereka belum mencapai tujuan saya  bahwa ukuran item tes. Dengan demikian, Anda harus, periksa frekuensi dengan Distracter sedikit pun-masing-masing dipilih oleh mereka yang gagal item. Jenis analisis ini sebaiknya dilakukan pada pretest di mana proporsi yang relatif besar murid dapat diharapkan gagal Produk. Jika beberapa item mengandung busur distracters yang tidak dipilih sama sekali, atau hanya jarang, revisi diperlukan.
Membangun Data Soal Tes   (Building a Test-Item File)
Suatu berkas dengan item yang efektif dapat dibangun dan dipelihara dengan mudah jika item yang dicatat pada kartu . Dengan menunjukkan kartu item minyak baik objektif dan wilayah isi ukuran item, adalah mungkin untuk mengajukan dadih di bawah kedua judul. Isi kursus tic dapat digunakan sebagai categorics utama, dengan tujuan membentuk subkategori.
Membangun item tes-file adalah sedikit mirip bangunan rekening bank. Beberapa tahun pertama prihatin terutama dengan melakukan setoran: penarikan harus ditunda sampai cadangan yang memadai dikumpulkan. Dengan demikian, barang yang dicatat pada kartu karena mereka dibangun; item-informasi analisis ditambahkan setelah item telah digunakan-, dan kemudian item efektif didepositkan pada file. Mula-mula tampaknya menjadi pekerjaan tambahan, dengan sangat sedikit kembali, tetapi dalam beberapa tahun sangat mungkin untuk mulai menggunakan beberapa item dari file dan melengkapi Dengan ini dibangun item baru lainnya. Karena file tumbuh menjadi mungkin untuk memilih sebagian besar item dari file untuk setiap tes tanpa terlalu sering mengulang. Untuk mencegah menggunakan item tes terlalu sering catatan pada kartu tanggal item digunakan.
Sebuah tes-file item menjamin semakin pentingnya kita beralih dari item yang mengukur tes pengetahuan tentang fakta kepada orang-orang yang mengukur pemahaman, aplikasi, dan keterampilan berpikir.
Item Perbankan Oleh Komputer
Beberapa sekolah menggunakan komputer untuk menjaga file item untuk masing-masing mata pelajaran (1 tingkatan kelas. Item dikodekan dan disimpan oleh (pembangun untuk memudahkan pengambilan. Hal ini memungkinkan untuk memilih item dan membangun sebuah tes yang cocok dengan serangkaian tes tertentu spesifikasi.
Jika sekolah tidak memiliki item komputer perbankan, guru harus didorong untuk menjaga file konten seperti yang diusulkan dalam bagian ini. Ini akan menyediakan kolam item untuk memulai sebuah item komputer bank ketika komputer dibeli. Dengan cepat meningkatnya penggunaan mikro komputer di sekolah-sekolah, hari itu akan tiba lebih cepat dari yang Anda harapkan


Kesimpulan
Dalam pembangunan individu item tes harus dilakukan atas ke final tes tahap pengembangan dan penggunaan. Menghadiri dengan prosedur untuk (1) merakit tes untuk digunakan, (2) administrasi dan skor tes, dan (3) menilai hasil meningkat akan memberikan jaminan bahwa hasil yang diperoleh valid.
Langkah-langkah awal dalam mempersiapkan ujian untuk digunakan akan lebih mudah jika item, Ini direkam pada kartu. Hal ini mempermudah tugas ubin mengedit item dan mengatur mereka di-tes. Pengeditan termasuk memeriksa setiap item untuk memastikan bahwa item; format yang tepat, bahwa item tersebut akan relevan dengan pembelajaran khusus hasil mengukur, dan bahwa aku bebas dari ambiguitas, kota-kota yang tidak relevan, dan fungsi bahan. Kelompok akhir item yang dipilih untuk ujian juga harus diperiksa terhadap Label spesifikasi, atau rencana tes lain, untuk memastikan bahwa sampel yang representatif dari hasil pembelajaran dan konten saja yang diukur. Dalam mengatur item dalam ujian, semua item dari satu jenis harus ditempatkan bersama dalam bagian terpisah. Petunjuk untuk pengujian harus disampaikan dengan jelas kepada murid tujuan ujian, waktu yang disediakan untuk menjawab, dasar untuk menjawab, prosedur untuk merekam jawaban, dan apa yang harus dilakukan untuk menebak.
Prosedur untuk melaksanakan tes .semua murid harus memberikan kesempatan yang adil untuk menunjukkan prestasi mereka. Baik fisik dan psikologis harus suasana kondusif untuk kinerja maksimum. Tidak perlu diinterupsi dan tidak adil bantuan dari murid-murid lain atau guru harus dihindari.
Skor tes dapat difasilitasi oleh skor kunci, atau mencetak stensil jika lembar jawaban terpisah digunakan. Menghitung setiap jawaban yang tepat sebagai salah satu titik. biasanya memuaskan.
Setelah tes telah mencetak gol, Anda harus menilai efektivitas fungsi masing­masing item dengan cars analisis item. Untuk norma-referenced tes, menggunakan prosedur statistik sederhana dalam menentukan indeks kesulitan item (persentase murid yang mendapat 'item kanan), kekuasaan diskriminatif item (perbedaan antara berprestasi tinggi dan rendah), dan efektivitas setiap Distracter (tingkat yang menarik lebih berprestasi rendah daripada berprestasi tinggi). Item-analisis indeks dapat dihitung baik secara mental dengan mudah dan cepat jika data didasarkan pada skor tertinggi 10 dan skor terendah 10 murid (yang sesuai untuk. Kelas ukuran berkisar 20-40 murid). Karena kriteria-referenced tes keahlian dirancang untuk menggambarkan tugas-tugas belajar siswa yang dapat melakukan, bukan untuk membedakan murid, indeks tradisional, analisis item tidak sepenuhnya tepat. Lebih bermakna di sini adalah perbandingan murid 'item tanggapan sebelum instruksi (pretest) dan setelah instruksi (posttest). Ini dapat dicapai dengan cara-respons item chart atau dengan menghitung indeks kepekaan terhadap efek instruksional. Jenis informasi im berguna untuk menentukan sejauh mana kriteria-referenced item penguasaan mengukur efek dimaksudkan instruksi. Hasil analisis barang berharga dalam membahas tes dengan murid-murid, dalam pekerjaan perbaikan perencanaan, dalam meningkatkan keterampilan mengajar dan pengujian, dan dalam memilih dan merevisi item untuk penggunaan masa depan. Untuk ini dan tujuan lain, bagaimanapun, analisis item-data hares ditafsirkan dengan hati-hati karena mereka yang terbatas dan tentatif alam. Membangun sebuah file tes 'item yang efektif melibatkan pencatatan minyak item kartu indeks, menambahkan item-analisa informasi, dan pengajuan kartu oleh daerah baik isi dan tujuan yang item ukuran. Seperti arsip tes barang berharga khususnya di bidang pencapaian kompleks di mana konstruksi tes item yang sulit dan memakan waktu, cukup Ketika barang berkualitas tinggi telah berkumpul, beban persiapan ujian ini sangat ringan. Soal komputer perbankan membuat tugas lebih mudah dan tersedia di sebagian besar sekolah.



SUMBER
Grounlund, NE. (1985). Measurement and Evaluation in Teaching 5 'h Edition. London: Collier Maemillan Publishers.

Tidak ada komentar:

Posting Komentar