Aufbau eines standardisierten Tests: 4 Schritte

Dieser Artikel beleuchtet die vier Hauptschritte beim Aufbau eines standardisierten Tests. Die Schritte sind: 1. Planung 2. Vorbereitung des Tests 3. Testen des Tests 4. Bewertung des Tests.

Schritt # 1. Planung:

„Die Testplanung umfasst alle verschiedenen Vorgänge, die zur Erstellung der Tests erforderlich sind. Dazu gehört nicht nur der Betrieb einer Gliederung oder einer Tabelle, in der der Inhalt oder die Optionen angegeben werden, die durch den Test abgedeckt werden sollen, sondern es muss auch die Schwierigkeit des Gegenstandes, die Art des Gegenstandes, die Richtung des Prüfers usw. eingehend berücksichtigt werden. “ (Lindquist )

Für standardisierte Tests ist eine systematische und zufriedenstellende Planung erforderlich. Ross meint: "Gute Tests finden nicht nur statt und sind das Ergebnis einiger Momente hoher Inspiration und Erhabenheit."

Es ist der Testbauer, der auf jeden Fall dafür verantwortlich ist, seinen Testgegenständen eine korrekte Form zu geben, und der den Test mit aller Sorgfalt und Aufrichtigkeit konstruiert.

Es umfasst folgende Aktivitäten:

1. Festlegung der Ziele / Zwecke.

2. Bestimmung der Gewichtung für verschiedene Unterrichtsziele.

3. Bestimmung der Gewichtung für verschiedene Inhaltsbereiche.

4. Bestimmen der einzufügenden Elementtypen.

5. Vorbereitung der Tabelle der Spezifikation-Blue Print.

6. Entscheidung über mechanische Aspekte wie Zeitdauer, Testgröße, Gesamtmarkierung, Druck, Buchstabengröße usw.

7. Geben Sie Anweisungen zur Bewertung des Tests und seiner Verwaltungsprozedur.

8. Die Gewichtung der verschiedenen Schwierigkeitsgrade der Fragen ist festzulegen.

(Die unter den Punkten 1 bis 5 genannten Tätigkeiten bedürfen weiterer Klarstellung.)

1. Festlegung der Ziele / Ziele:

Vor dem Aufbau des Tests müssen die Objekte formuliert werden. Die Aufmerksamkeit sollte auf die Fähigkeit der Tests gerichtet werden, das Ausmaß, in dem die Bildungsziele erreicht werden, effizient zu messen. Die Bildungsziele können auf verschiedene Weise klassifiziert werden. Wie auch immer die Klassifizierung aussehen mag, der Lehrplan muss die Veränderungen des Kindes bewirken, die als Ziele vorgesehen sind.

Der Test sollte so gestaltet sein, dass er darauf hinweisen kann, inwieweit die Ziele, um Verhaltensänderungen des Kindes zu bewirken, durch den Lehrplan erreicht wurden, den er ihnen vermittelt hat.

Die Aufmerksamkeit sollte auch auf den Zweck gerichtet sein, zu dem der Test dienen soll. Wenn der Test so aufgebaut ist, dass die Schüler klassifiziert werden, muss bei der Konstruktion auf die Klassifizierungsfähigkeit geachtet werden. Wenn es jedoch zu diagnostischen Zwecken dient, sollte es so konstruiert sein, dass es die individuellen Schwierigkeiten der Schüler diagnostizieren kann.

2. Bestimmung der Gewichtung verschiedener Lernziele:

Der wichtigste Schritt bei der Testplanung ist die Ermittlung der Unterrichtsziele. Jedes Fach hat andere Unterrichtsziele. In den Fächern Naturwissenschaften, Sozialwissenschaften und Mathematik werden die Hauptziele nach Wissen, Verstehen, Anwendung und Fertigkeit kategorisiert, während in Sprachen die Hauptziele nach Wissen, Verstehen und Ausdruck kategorisiert werden.

Wissensziel wird als niedrigste Lernstufe betrachtet, während Verständnis, Anwendung von Wissen in der Wissenschaft oder Verhaltenswissenschaften als höhere Lernebene betrachtet werden.

3. Bestimmung der Gewichtung für verschiedene Inhaltsbereiche:

Die wichtigste Aufgabe bei der Erstellung eines Leistungstests ist das Festlegen einer Gliederung des Inhaltsbereichs. Es gibt den Bereich an, in dem die Schüler ihre Leistung zeigen sollen. Es hilft, eine repräsentative Auswahl des gesamten Inhaltsbereichs zu erhalten.

Es verhindert auch die Wiederholung oder Auslassung einer Einheit. Nun stellt sich die Frage, wie viel Gewicht auf welche Einheit entfällt. Einige Experten sagen, dass der betroffene Lehrer dies unter Berücksichtigung der Wichtigkeit des Kapitels entscheiden sollte.

Andere sagen, es sollte nach dem Themenbereich des Lehrbuchs entschieden werden. In der Regel werden die Seiten des Themas, die Gesamtseiten des Buches und die Anzahl der zu erstellenden Elemente festgelegt.

4. Ermittlung der Artikeltypen:

Elemente, die in der Testkonstruktion verwendet werden, lassen sich grob in zwei Typen einteilen, z. B. Objekttypobjekte und Aufsatztypelemente. In einigen Unterrichtszwecken sind die objektiven Elemente am effizientesten, während sich die Aufsatzfragen für andere als zufriedenstellend erweisen.

Geeignete Elementtypen sollten entsprechend den zu messenden Lernergebnissen ausgewählt werden. Wenn zum Beispiel das Ergebnis geschrieben wird, sind Artikel der Lieferart hilfreich.

Wenn das Ergebnis eine korrekte Antwort identifiziert, sind Auswahltypen oder Erkennungstypen hilfreich. Es ist also zu diesem Zeitpunkt zu entscheiden und zu planen.

LA = Lange Antwort

SA = Kurze Antwort

VSA = Sehr kurze Antwort

5. Vorbereitung eines “BLUEPRINT” oder eines dreidimensionalen Diagramms:

Vorbereitung des Blueprints oder der Spezifikationstabelle in dreidimensionalem Karteninhalt, Ziel und Typ der Elemente, wobei die Anzahl der Elemente in jeder Zelle oder Abteilung angegeben wird. Es handelt sich lediglich um ein Rahmenwerk, das ein klares Bild des Testdesigns liefert und als Leitfaden dient.

Die drei Dimensionen des Bauplans bestehen aus Inhaltsbereichen in horizontalen Reihen und Zielsetzungen und Fragenformen in vertikalen Spalten. Sobald der Entwurf vorbereitet ist, kann der Papiersetzer die Elemente schreiben / auswählen und das Fragenpapier vorbereiten.

Ein Beispiel für ein Blaupause-Format ist unten angegeben:

Hinweis:

Bitte geben Sie die Anzahl der Fragen in Klammern und die Markierungen außerhalb der Klammern ein.

E = Frage des Aufsatztyps, SA = Kurzantworttyp, VS A = Sehr kurze Antwort.

Schritt # 2. Den Test vorbereiten:

Der nächste Schritt nach der Fertigstellung des Entwurfs ist das Schreiben entsprechender Fragen gemäß den in dem Entwurf festgelegten allgemeinen Parametern. Man sollte jeweils einen kleinen Block des Bauplans nehmen und die erforderlichen Fragen aufschreiben.

Daher müssen für jeden ausgefüllten Blueprint-Block Fragen nacheinander geschrieben werden. Sobald dies geschehen ist, haben wir alle Fragen, die den im Blueprint festgelegten Anforderungen entsprechen.

Standardisiertes Testschreiben erfordert alle Arten von Sorgen und Überlegungen. Es muss genügend Zeit aufgewendet werden, um über die Gewichtung der zu behandelnden Inhalte und Bereiche nachzudenken.

In diesem Schritt werden die spezifischen Regeln für das Erstellen verschiedener Arten von Testobjekten besprochen.

In diesem Stadium müssen wir uns vorbereiten:

(i) Die Testobjekte.

(ii) die Anweisungen für die Testgegenstände.

(iii) die Anweisungen für die Verwaltung.

(iv) Die Anweisungen für das Scoring.

(v) Ein Diagramm mit Fragenanalyse.

(i) Vorbereitung der Testgegenstände

Die Vorbereitung der Testobjekte ist die wichtigste Aufgabe im Vorbereitungsschritt. Daher muss bei der Vorbereitung eines Prüflings sorgfältig vorgegangen werden. Das Erstellen von Testobjekten ist nicht so einfach. Es ist die Aufgabe von Testspezialisten und Experten. Ein erfahrener Lehrer, der im Testbau ausreichend geschult ist, kann entsprechende Testobjekte vorbereiten.

Es gibt bestimmte Regeln und Richtlinien für die Konstruktion von Testobjekten. Dazu muss man Zugang zu all diesen Richtlinien haben und auch zur Taxonomie der Ziele. Im Allgemeinen müssen die Testobjekte klar, umfassend und frei von Zweideutigkeiten sein.

Die Sprache der Elemente sollte so gewählt werden, dass der Inhalt und nicht die Form der Elemente die Antwort bestimmt. Die Elemente mit versteckten Bedeutungen sollten nicht enthalten sein. Die Aussage der Gegenstände sollte nicht zufällig aus den Büchern entnommen werden. Alle Elemente eines bestimmten Typs sollten zusammen platziert werden.

Das in den Items verwendete Vokabular sollte so einfach sein, dass es von allen verstanden werden kann. Eine regelmäßige Abfolge korrekter Antworten sollte vermieden werden. Der Test kann mehrere Arten von Testobjekten enthalten.

Der Test muss in bestimmten Zeitabständen einer kritischen Revision unterzogen werden. Häufig ist es wünschenswert, dass im Test mehr Elemente enthalten sind als die tatsächlich benötigte Anzahl. Im Vorentwurf ist es besser, wenn die doppelte Anzahl der benötigten Artikel enthalten ist.

Bei der Konstruktion der Testobjekte sollten nur die Elemente nicht berücksichtigt werden, die den Speicher oder die Erkennung betonen. Die Gegenstände sollten so ausgewählt werden, dass die Schüler die Gewohnheit lernen, ihr Wissen mit dem tatsächlichen Leben in Beziehung zu setzen.

Nachdem die Testobjekte gerahmt sind, müssen sie ordnungsgemäß angeordnet und zu einem Test zusammengefügt werden. Wenn unterschiedliche Formen von Testgegenständen verwendet werden, sollten diese vorzugsweise formweise gruppiert werden. Außerdem sollen leichte Gegenstände am Anfang einen Platz erhalten, die mittleren Schwierigkeitsgrade in der Mitte und schwierige Gegenstände am Ende.

Die Testobjekte können in der Reihenfolge der erwarteten Schwierigkeit angeordnet werden. Natürlich gibt es verschiedene Möglichkeiten, die Fragen zusammenzustellen, und wir können die Fragen zusammenstellen, die unserem Zweck und der Bequemlichkeit der Interpretation entsprechen.

(ii) Vorbereitung der Richtung zu Testgegenständen:

Dies ist der am meisten vernachlässigte Aspekt der Testkonstruktion. Im Allgemeinen achtet jeder auf die Konstruktion von Testobjekten. Die Prüfer legen also den Anweisungen keine Anweisungen bei. Die Gültigkeit und Zuverlässigkeit der Prüflinge hängt jedoch in hohem Maße von den Anweisungen für die Prüfung ab.

NE Gronlund hat vorgeschlagen, dass der Testhersteller eine klare Richtung vorgeben sollte:

1. Zweck des Testens

2. Die für die Beantwortung vorgesehene Zeit.

3. Die Basis der Beantwortung.

4. Das Verfahren zum Aufzeichnen von Antworten.

5. Die Methoden zum Erraten.

Manchmal sind die Anweisungen zum Testen von Gegenständen so uneindeutig, dass das Kind ihnen nicht folgen kann, und als solche reagiert es auf die Gegenstände in einer Art und Weise, die er zu diesem Zeitpunkt für passend hält, oder gibt den nächsten Gegenstand einfach weiter und lässt ihn unbeantwortet.

Aufgrund fehlender klarer Anweisungen reagiert das Kind zu unterschiedlichen Zeiten unterschiedlich, was die Zuverlässigkeit des Tests beeinträchtigen würde.

(iii) Vorbereitung der Anweisungen zur Verabreichung:

Es ist eine klare und detaillierte Anleitung zu geben, wie der Test durchgeführt werden soll. Die Bedingungen, unter denen der Test durchgeführt werden soll, wann der Test durchgeführt werden soll (ob mitten in der Sitzung oder am Ende der Sitzung usw.), innerhalb welcher Frist er verabreicht werden soll, sind usw. klar gesagt werden.

Wenn der Test über separate Abschnitte verfügt, sind Fristen für jeden Abschnitt anzugeben. Die für den Test erforderlichen Materialien (z. B. Diagrammpapiere, Logarithmtabellen usw.) müssen angegeben werden.

In den Anweisungen muss klar angegeben sein, welche Vorsichtsmaßnahmen der Administrator zum Zeitpunkt der Administration treffen sollte. Daher muss eine angemessene und klare Anleitung für die Testverwaltung erstellt werden.

(iv) Vorbereitung der Bewertungsrichtung:

Um die Objektivität bei der Bewertung zu erleichtern, sind "Bewertungsschlüssel" bereitzustellen. Der Bewertungsschlüssel ist eine vorbereitete Liste mit Antworten auf eine Reihe von objektiven Fragen. Ein Bewertungsschlüssel wird vorbereitet, indem der Schlüssel (oder die richtige Antwort) zu jeder Frage für jedes Element seriell aufgelistet wird.

Für Kurzantworten und Aufsatzfragen sind Markierungsschemata vorzubereiten. Solche Bewertungsschlüssel und Markierungsschemata müssen sorgfältig vorbereitet werden. Sie helfen bei der Bewertung des Tests als Leitfaden und sorgen für Objektivität bei der Bewertung.

(v) Erstellung einer frageweisen Analysentabelle:

Es kann eine Fragenanalysekarte erstellt werden, in der jede Frage analysiert wird. Dieses Diagramm zeigt den Inhaltsbereich, den die Frage abdeckt, das zu messende Ziel (mit Angabe), den Typ, die zugewiesenen Marken, den erwarteten Schwierigkeitsgrad und die für die Beantwortung benötigte Zeit.

In dieser Tabelle werden nicht nur die Elemente analysiert, sondern es wird auch ein Bild der Abdeckung von Inhalten, Zielen, Fragentypen und verschiedenen Schwierigkeitsgraden usw. erstellt. Darüber hinaus können Sie sich ein Bild über die Gesamtzeit machen, die für die Aufnahme des Projekts erforderlich ist Prüfung. Dieses Diagramm hilft uns zu überprüfen, ob der Test gemäß dem Blueprint vorbereitet wurde oder nicht.

Schritt 3: Testen des Tests:

Da der Test von einer Gruppe von Personen und Experten vorbereitet wird, kann er nicht völlig fehlerfrei sein. Daher erfordert jede Standardisierung die Vorbereitung einer Testform des Tests und seiner Prüfung über eine Stichprobenpopulation.

Das Ausprobieren hat folgende Ziele:

1. Identifizierung der fehlerhaften oder mehrdeutigen Elemente.

2. Aufdeckung der Schwäche im Mechanismus der Testverwaltung.

3. Ermittlung der nicht funktionierenden oder unplausiblen Distraktoren bei Multiple-Choice-Tests.

4. Bereitstellung von Daten zur Bestimmung des Schwierigkeitsgrades von Gegenständen.

5. Bereitstellung von Daten zur Bestimmung des Unterscheidungswerts der Gegenstände.

6. Bestimmung der Anzahl der Elemente, die in die endgültige Form des Tests aufgenommen werden sollen.

7. Festlegen der Frist für das endgültige Formular.

Der Hauptzweck des Ausprobieren besteht darin, die guten Artikel auszuwählen und die schlechten Artikel abzulehnen.

Das Try-Out erfolgt in drei Schritten:

1. Vorversuch

2. Ordnungsgemäße Erprobung.

3. Abschlusstest.

1. Vorversuch:

Der Vorversuch wird individuell durchgeführt, um die Sprachschwierigkeiten und die Mehrdeutigkeit der Elemente zu verbessern und zu modifizieren. Dieses Try-Out wird an 10 oder 15 Personen durchgeführt. Die Verarbeitbarkeit der Artikel wird beachtet. Aufgrund von Beobachtungen und Reaktionen der Einzelnen können die Elemente gleichzeitig verbessert und modifiziert werden. So wird der erste Entwurf vorbereitet und für das richtige Ausprobieren oder Gruppen-Ausprobieren gedruckt oder cyclostyliert.

2. Das richtige Tryout:

Der richtige Test wird an einer Gruppe von mindestens 40 Studenten / Einzelpersonen durchgeführt. Der Zweck besteht darin, gute Artikel für den Test auszuwählen und schlechte Artikel abzulehnen.

Dieser Schritt umfasst die folgenden Aktivitäten:

(A) Artikelanalyse.

(B) Vorbereitung des abschließenden Entwurfs des Tests.

(A) Artikelanalyse:

Ein Test sollte weder zu einfach noch zu schwierig sein. und jeder Punkt sollte die Gültigkeit zwischen den Studenten mit hohem und geringem Erfolg unterscheiden. Das Verfahren zur Beurteilung der Qualität eines Artikels wird als Artikelanalyse bezeichnet.

Das Artikelanalyseverfahren folgt den folgenden Schritten:

1. Die Testpapiere sollten von der höchsten zur niedrigsten Punktzahl geordnet sein.

2. Wählen Sie 27% Testpapiere vom höchsten und 27% vom untersten Ende aus. Wenn der Test beispielsweise bei 120 Schülern durchgeführt wird, wählen Sie 32 Testpapiere vom höchsten und 32 Testpapiere vom unteren Ende aus.

3. Bewahren Sie die anderen Testpapiere auf, da sie nicht in der Artikelanalyse benötigt werden.

4. Tabellieren Sie die Anzahl der Schüler in der oberen und unteren Gruppe, die für jedes Testobjekt eine Alternative ausgewählt haben. Dies kann auf der Rückseite des Testpapiers erfolgen oder es kann eine separate Testobjektkarte verwendet werden (siehe Tabelle (14.1)).

Wie wir wissen, hängt die Qualität oder das Verdienst eines Tests von den Einzelteilen ab, aus denen er besteht. Daher dürfen nur die Artikel, die unserem Zweck entsprechen, aufbewahrt werden. Die Artikelanalyse ist ein wesentlicher Bestandteil der Zuverlässigkeit und Validität eines Tests.

Der Wert eines Gegenstands wird aus drei Hauptwinkeln beurteilt, nämlich:

(i) Schwierigkeitsgrad des Artikels,

(ii) Unterscheidungskraft der Sache,

(iii) Wirksamkeit von Distraktoren.

Eine hypothetische Illustration:

Wenn ein Test an 120 Schülern durchgeführt wird, sind 27% der Testpapiere vom höchsten Ende 32 und 27% der Testpapiere vom niedrigsten Ende sind 32.

(i) Schwierigkeitsindex des Artikels / Artikelschweregrads:

Der Schwierigkeitsindex des Artikels ist ein wichtiger Bestandteil der Testkonstruktion. Ist ein bestimmtes Element zu einfach, antworten alle Schüler darauf. Wenn alle Schüler die gleiche Punktzahl erreichen, ist der eigentliche Zweck des Tests nicht erfüllt. Wenn ein Objekt von keinem Testpersonen beantwortet werden kann, ist das Objekt entweder zu schwierig oder falsch konstruiert. Was nützt es, solche Gegenstände in einem Test zu haben? Es ist also offensichtlich, dass zu einfache und zu schwierige Gegenstände vollständig weggeworfen werden müssen.

Es ist wünschenswert, dass Gegenstände mit mittlerem Schwierigkeitsgrad in einen Test eingeschlossen werden. Bei der Analyse, die in der Testphase durchgeführt wird, behalten die Tester im Allgemeinen Gegenstände im Schwierigkeitsgrad von 16% bis 84%.

Die Artikelschwierigkeit (ID) wird anhand der Formel berechnet.

ID = R / NX 100

wobei R = Anzahl der Probanden, die richtig antworten.

N = Gesamtzahl der Testpersonen, die den Artikel ausprobiert haben.

In unserem Beispiel von 64 Schülern aus der oberen und unteren Gruppe haben 40 Schüler den Gegenstand richtig beantwortet und 60 Schüler haben den Gegenstand ausprobiert. Dann wird die Artikelschwere als berechnet

Artikelschwierigkeit = 40/60 x 100 = 66, 67

Da es üblich ist, die 16- bis 84-Prozent-Regel einzuhalten, um die Schwierigkeit des Artikels zu berücksichtigen, fällt unsere berechnete ID in diesen Bereich. Daher hat der Gegenstand den richtigen Schwierigkeitsgrad. Das bedeutet, wenn ein Artikel eine ID von mehr als 84% ​​hat, ist er ein zu einfacher Artikel. Wenn er weniger als 16% beträgt, ist der Artikel ein zu schwieriger Artikel.

(ii) Unterscheidungskraft des Gegenstands:

Die Unterscheidungskraft (dh der Gültigkeitsindex) eines Objekts bezieht sich auf den Grad, in dem ein bestimmter Artikel zwischen Schülern diskriminiert, die sich in der durch den Test insgesamt gemessenen Funktion stark unterscheiden.

Eine Schätzung des Diskriminierungsindex eines Artikels kann durch folgende Formel erhalten werden:

woher

RU = Anzahl der richtigen Antworten aus der oberen Gruppe.

RL = Anzahl der richtigen Antworten aus der unteren Gruppe.

N = Gesamtzahl der Schüler, die sie ausprobiert haben.

In unserem Beispiel haben 30 Schüler der oberen Gruppe den Artikel richtig und 10 aus der unteren Gruppe den Artikel richtig beantwortet.

Somit ist R U = 30, R L = 10 und N = 60

Diskriminierender Index = (30 - 10) / (60/2) = 20 / 30, 67

Ein Diskriminierungsindex wird normalerweise als Dezimalzahl ausgedrückt. Wenn es einen positiven Wert hat, hat der Artikel eine positive Diskriminierung. Dies bedeutet, dass ein größerer Anteil der kenntnisreicheren Schüler als die armen Schüler den Artikel richtig verstanden hat. Wenn der Wert Null ist, hat der Artikel eine Unterscheidung von Null.

Dies kann vorkommen:

ich. Weil der Artikel zu leicht oder zu schwer ist; oder

ii. Weil es mehrdeutig ist.

Wenn mehr schlechte Schüler als gute Schüler den richtigen Punkt erhalten, würde dies eine negative Diskriminierung bewirken. Bei einer kleinen Anzahl von Studenten kann dies ein zufälliges Ergebnis sein. Es kann jedoch bedeuten, dass das Element mehrdeutig oder falsch geschrieben ist.

Der Artikel mit dem Index null oder negativer Diskriminierung muss verworfen oder überarbeitet werden. Im Allgemeinen ist der Gegenstand umso besser, je höher der Diskriminierungsindex ist.

(iii) Wirksamkeit von Distraktoren:

Ein Distraktor gilt als guter Distraktor, wenn er mehr Schüler aus der unteren Gruppe anzieht als die obere.

Beispiel:

Angenommen, insgesamt 40 Antwortbücher (jeweils in der oberen und in der unteren Gruppe, jeweils 20).

Nachfolgend finden Sie eine hypothetische Darstellung, in der das Sternchen die richtige Antwort anzeigt:

In der Abbildung sind die Alternativen A und C dahingehend wirksam, dass sie mehr Schüler aus der unteren Gruppe als aus der oberen Gruppe anziehen. Aber Alternative D ist ein schlechter Distraktor, weil er niemanden anzieht und deshalb nutzlos ist. Der Artikel hat nur Optionen und die Erfolgschancen durch bloßes Schätzen werden erhöht. Alternative E ist auch schlecht, weil sie einen höheren Anteil der Guten anzieht als schlechte Schüler.

Der Artikelschreiber muss sich fragen:

„Warum haben sich die helleren Studenten für E interessiert? War es wegen Zweideutigkeit? War es, weil es zwei gleichermaßen richtige Antworten gab? ”Kurz gesagt, dieser Punkt sollte durch Ändern der Alternativen D und E überarbeitet werden.

(B) Vorbereitung des abschließenden Entwurfs des Tests:

Nach der Artikelanalyse werden nur gute Artikel mit angemessenem Schwierigkeitsgrad und zufriedenstellender Unterscheidungskraft zurückbehalten. Diese Elemente bilden den abschließenden Test. Dementsprechend werden gute Artikel aus der großen Anzahl von Artikeln ausgewählt.

Einige davon können geändert werden, und die gewünschte Anzahl von Elementen wird für den endgültigen Entwurf entsprechend dem Entwurf ausgewählt. Die Elemente werden im endgültigen Entwurf nach Schwierigkeitsgrad sortiert. Die für den Test benötigte Zeit wird bestimmt. Nun wird der Test einer großen repräsentativen Probe zugeordnet und die Testpapiere werden bewertet.

3. Finales Ausprobieren:

Der abschließende Test wird an einer großen Stichprobe von etwa 400 Personen durchgeführt, um die Zuverlässigkeit und Gültigkeit des Tests zu ermitteln. Ihr Zweck ist es, auch die Dauer des Tests zu bestimmen. Ziel dieses Versuchs ist es, die Mängel und Mängel der Prüflinge zu ermitteln. Bei der Artikelanalyse werden zu einfache und zu schwierige Artikel verworfen. Es werden nur Elemente mit durchschnittlichem Schwierigkeitsgrad einbezogen oder beibehalten.

Fast alle Vorsichtsmassnahmen beim Try-out sollten bei der Durchführung des abschließenden Tests getroffen werden. Das ausgefüllte Antwortblatt sollte mit Hilfe des Bewertungsschlüssels bewertet und die Bewertungen für die statistische Behandlung tabelliert werden.

Schritt # 4. Den Test auswerten:

Die Standardisierung und Bewertung des Tests erfolgt auf folgende Weise:

1. Die endgültige Form des Tests wird gedruckt. Das Antwortblatt wird ebenfalls gedruckt.

2. Die für den Test benötigte Zeit wird bestimmt, indem die durchschnittliche Zeit von drei Schülern bei der Beantwortung des Tests ermittelt wird. Die zu diesem Zweck ausgewählten Schüler repräsentieren drei Gruppen - hell, durchschnittlich und unterdurchschnittlich.

3. Anweisungen für die Personen, die den Test durchführen werden, werden vorbereitet und gedruckt.

4. Die Bewertungen sind tabellarisch dargestellt und es werden verschiedene Maßzahlen der zentralen Tendenzen, Mittelwert, Mittelwert und Art der Abweichung - Standardabweichung, Quartilabweichung usw. - ermittelt.

Die Bewertungen werden auf einem Diagrammblatt dargestellt, um die Normalität der Verteilung und des Zeichnens zu vergleichen und verschiedene Perzentilwerte zu erhalten. Abgeleitete Werte wie T-Score und Z-Score usw. werden geschätzt.

Normen wie Altersnormen, Klassennormen, Geschlechtsnormen, ländliche Stadtnormen usw. werden gemäß der Anforderung berechnet.

5. Die Gültigkeit der Testergebnisse wird durch Korrelation der Testergebnisse mit einem anderen Kriterium geschätzt. Die Konstruktvalidität kann durch Faktorenanalyse ermittelt werden. Verschiedene Methoden zur Bestimmung der Gültigkeit wurden in separaten Einheiten erörtert.

6. Bei der Bewertung eines neu erstellten Tests wird auch die Zuverlässigkeit geschätzt. Bei zwei parallelen Formularen können Sie die Zuverlässigkeit berechnen, indem Sie die Bewertungen dieser beiden parallelen Formulare miteinander korrelieren.

Wenn keine parallelen Formen erstellt wurden, kann die Zuverlässigkeit durch die Split-Half-Methode oder durch die Methode der rationalen Äquivalenz bestimmt werden. Der Test kann abgelesen werden, und die Zuverlässigkeit kann durch Test-Retest-Methode geschätzt werden.

7. Zum Schluss müssen wir bewerten, inwieweit ein Test aus Sicht der Verwaltung, Bewertung, Zeit und Wirtschaftlichkeit brauchbar ist. Der Test muss Perzentilnormen, Normnormale, Altersnormen und Klassennormen enthalten, die die Interpretation der Ergebnisse erleichtern.