Unser veraltetes Testsystem reformieren

Zu den möglichen Zielen der Schulreform gehören der Lehrplan (was sollte unterrichtet werden), Unterricht (wie Unterricht stattfindet und wer es tut) und Testen (die Methode, mit der Lernen gemessen wird). Da ich bereits den Unterricht besprochen habe, möchte ich diese Ausgabe verwenden, um zu diskutieren, was beim Testen geändert werden muss, ein Prozess, der derzeit genauso veraltet ist wie der Unterricht selbst.

Ein Großteil dieser Obsoleszenz resultiert aus der Tatsache, dass sich die Erziehungsindustrie weiterhin auf die Annahmen stützt, die dem klassischen psychometrischen Modell zugrunde liegen, das frühe Versuche zur Entwicklung von Tests für Intelligenz und Eignung gefördert hat. Annahmen, die für Konstrukte, die (a) von unbekannter Ätiologie waren, hätten haltbar sein können, (b) Gegenstandsbereiche besaßen, die nicht erschöpfend spezifiziert werden konnten, und (c) geglaubt wurden, (fälschlicherweise) sowohl stabil als auch unveränderlich für den Unterricht zu sein. Von gleicher Wichtigkeit war, dass eine perfekte Punktzahl (oder eine Punktzahl von Null) bei den resultierenden Tests nicht quantitativ interpretiert werden konnte, weil es für irgendeinen Menschen unmöglich war, Perfektion auf den fraglichen Attributen erreicht zu haben (oder völlig frei von solchen zu sein).

Das Lernen auf der Schule hingegen besitzt keine dieser Einschränkungen, obwohl kommerzielle "Leistungstests" so konstruiert sind, als ob sie es wären. Dies hat sich als äußerst bedauerlich erwiesen, da die eigentlichen Ziele von Bildungstests darin bestehen, festzustellen, welchen Anteil des Lehrplans jeder Schüler bewältigt hat und was noch zu unterrichten (oder neu zu unterrichten) ist.

Wie Tests des Schullernens konstruiert werden sollten

Da wir wissen, was das Lernen (den Unterricht) bewirkt und was in unseren Schulen gelehrt werden sollte (der Lehrplan), ist die Bewertung des schulischen Lernens keine Wissenschaft. Unter der Annahme, dass unser Testzeitraum weiterhin ein Schuljahr ist, müssen wir "alles" tun:

1. Geben Sie den gesamten Lehrplan der Grundschule durch die Verwendung von Unterrichtszielen detailliert genug an, um zu ermöglichen, dass für jedes Ziel mehrere Testobjekte geschrieben werden können.

2. Konstruieren Sie Schullern-Tests anhand eines vertretbaren, transparenten Verfahrens aus dieser Liste von Lernzielen und Testobjekten. Diese Tests können auf einzelne akademische Fächer (z. B. Mathematik, Leseverständnis) oder auf speziellere Unterrichtsthemen innerhalb eines Fachs (z. B. Visuelle Vokabeln) basieren.

3. Verwalten Sie jeden Test zweimal (vorzugsweise über Computer, so dass die Ergebnisse sofort verfügbar, sicher gespeichert und entsprechend verteilt werden können), einmal am Anfang des Jahres und einmal am Ende. (Es ist nicht erforderlich, identische Ziele oder Punkte zweimal zu bewerten, da es nicht schwierig ist, die Gleichwertigkeit zu gewährleisten, wenn die gleichen Stichprobenverfahren angewandt werden. Die Prüfungen müssen jedoch zweimal im selben Jahr durchgeführt werden, da die Schule derzeit wenig Kontrolle hat über was während der Sommermonate auftritt.)

Der Unterschied zwischen den Testergebnissen des Jahresanfangs und des Jahresendes stellt dann den absoluten Betrag des Lehrplans dar, den jeder Schüler in diesem Jahr gelernt hat. Das meiste wird eine Funktion des Schulunterrichts sein, obwohl es (und wird es immer sein) ein gewisser Fehler im Zusammenhang mit Schlussfolgerungen basierend auf Testergebnissen aufgrund von Stichproben, wie sich ein Schüler während einer der Testsitzungen gefühlt hat, einer Extraschule ausgesetzt ist Anweisung und so weiter. Keine jemals entwickelte Messung (physisch, psychologisch oder pädagogisch) wird ohne einen gewissen Grad an Fehlern durchgeführt.)

Testergebnisse, die auf diese Weise konstruiert wurden, haben eine Reihe interessanter Eigenschaften, von denen einige sind:

1. Es ist nicht notwendig, Standardwerte zu verwenden (z. B. Notenäquivalenzen, Prozentränge usw.). Alle diese algebraischen Manipulationen, einschließlich der normalen Kurve selbst, werden nur dazu verwendet, Rangfolgen einzustufen, um sie miteinander zu vergleichen, was nur notwendig ist, wenn ein Test nicht in der Lage ist, die absolute Menge von etwas zu messen. Tests zur Beurteilung des schulischen Lernens sollten in der Lage sein, sinnvolle Nullen (keine Angabe des Lehrplans) und perfekte Ergebnisse (dh 100% Beherrschung des Lehrplans) zu erzielen. Mit anderen Worten, die Punktzahlen, die durch solche Tests erzeugt werden, würden die Menge des Lernens repräsentieren, die stattfindet. Um sie auf eine einfache geordnete Rangliste zu reduzieren, wäre Idiotie.

2. Tests wie diese haben direkt anschauliche Implikationen, da jeder Gegenstand ein Unterrichtsziel darstellt und ein verpasster Gegenstand daher ein spezifisches ungelerntes Konzept darstellt, das gelehrt (oder neu unterrichtet) werden muss. Die aussagekräftigste Analyseeinheit wird daher oft die Antwort eines einzelnen Schülers auf jeden einzelnen Gegenstand.

3. Weil alle interessierten Parteien (Lehrer, Eltern und Schüler) Zugang zu den Unterrichtszielen haben können, die unterrichtet werden sollten, und zu den Arten von Gegenständen, die zur Bewertung des Lernens verwendet werden: (a) Lehrer sollten den Test unterrichten und anwenden Scheinprüfungen, die auf ähnlichen (aber nicht identischen) Punkten basieren, um festzustellen, welche Schüler welche Ziele unmittelbar nach dem Unterricht gemeistert haben; (b) Eltern könnten auch die Fortschritte ihrer Kinder während des Schuljahres beurteilen; und (c) die Schüler werden sowohl mit dem Testverfahren als auch mit den Arten von Gegenständen vertraut gemacht, mit denen sie Ende des Jahres konfrontiert werden.

4. Ressourcen wie diese (dh das Vorhandensein einer umfassenden Übersetzung des Lehrplans über Unterrichtsziele, die jeweils von einem Testmaterial begleitet werden) könnten auch die Entwicklung ergänzender digitaler Nachhilfesoftware beschleunigen und die praktische Nachhilfe effektiver machen und reduzieren die Auswirkungen von Testunterschieden, die zur sozioökonomischen Testlücke beitragen.

Aus meiner Sicht ist die einzige unbeantwortete Frage, warum es außerhalb der Testindustrie einen Widerstand geben sollte, einen solchen Prozess für unser derzeit veraltetes Testmodell zu ersetzen.

Für eine umfassendere Diskussion über Schulversuche, siehe Kapitel Acht von EINFACH ZU SCHÄDEN: Ein Fall für den Bildungswandel (Oxford University Press) [[email protected]]