Wozu Satzergänzungstests?
Die Anforderungen der neuen Studienstruktur (Bologna-System) haben in
allen Fächern die Belastung des Lehrkörpers durch die Organisation,
Durchführung und Korrektur von Prüfungen und Übungen massiv erhöht.
Viele Mitglieder des Lehrkörpers setzen daher grosse Hoffnungen darauf,
dass ein Teil dieser Belastung durch den Einsatz von Computern
vermindert werden können.
Was Prüfungen betrifft (sog. summative Tests), so stellt OLAT in der Tat einige Mittel für das "E-Assessment" zur Verfügung. Diese E-Assessment-Funktionen beschränken sich zur Zeit aber auf die klassischen Auswahltests (Single Choice, Multiple Choice und Kprim) sowie Lückentests. Diese Testformen sind zwar automatisch einfach auswertbar, aber sie auferlegen der Formulierung von Fragen ein sehr enges Korsett. Das macht sie nur beschränkt geeignet, den Prüfungsaufwand zu verringern. Dies gilt ganz besonders für die Philosophische Fakultät, wo Fragen oft nicht durch knappe (eindeutig richtige oder eindeutig falsche) Aussagen beantwortet werden können, geschweige denn durch präzise Zahlwerte oder wohldefinierte Fachbegriffe. Idealerweise lässt man in solchen Situationen Freitextantworten zu (bis hin zu ganzen Aufsätzen), aber die kann man nicht automatisch durch Software bewerten lassen.
Noch problematischer ist die Situation bei den sog. formativen Tests,
jenen Tests also, welche nicht zum Bewerten einer Leistung eingesetzt
werden, sondern zum individuellen Üben und Vertiefen durch die
Studierenden, idealerweise mit Hilfe durch Tutoren. In dieser Situation
ist von Seiten der Tutoren aber das Abgeben detaillierter Kommentare und
massgeschneiderter Erklärungen gefragt, nicht das Vergeben von Punkten,
und das ist noch schwieriger zu automatisieren als die Bewertung von
summativen Tests.
Ein besonderer Typ von am Institut für Computerlinguistik der Universität Zürich entwickelten Tests, Satzergänzungstests,
nehmen eine Mittelposition zwischen einengenden Auswahl-Tests und
maschinell nicht auswertbaren Tests mit Freitextantworten ein. Statt dem
blossen Auswählen von vorgegebenen Antworten erlauben
Satzergänzungstests das Formulieren von (auch komplexen) sprachlichen
Antworten, aber nicht in vollständig freier Form, sondern durch das
interaktive Zusammenfügen von in Menüform vorgeschlagenen
Satzfragmenten, welche auch Lücken beinhalten können. Und statt einer
vorformulierten Antwort wird dann vom System ein detaillierter und sehr
spezifischer Kommentar zur benutzererzeugten Antwort generiert.
Schliesslich kann das System auch komponentenweise Zusatzfragen
zu den Antworten erzeugen, ganz individuell auf die einzelnen
Komponenten der einzelnen Antworten bezogen. Je nach Ausrichtung des
Tests können die einzelnen Antwortkomponenten zusätzlich mit Punkten bewertet oder nur natürlichsprachlich kommentiert werden.
Satzergänzungstests können als formative oder als summative Tests verwendet werden
- Wenn im Sinn von formativen Tests eingesetzt, sind vor allem die hochspezifischen Kommentare zu den benutzergenerierten Aussagen wichtig.
Kommentare dienen primär dazu, typische Fehler (faktische Irrtümer, Fehlkonzepte, Widersprüche) zu identifizieren und sie detailliert zu korrigieren.
Kommentare können aber auch ganz gezielt Links auf Texte liefern, in denen genau die diagnostizierten Wissensdefizite angesprochen werden.
Auch Verknüpfungen zu multimedialen Inhalten sind problemlos möglich.
Durch das Verketten von Satzergänzungstest können die Benutzer für jede Fehlerkomponente je in eine spezifische Korrekturschlaufe gesteuert werden (im Bedarfsfall iterativ - so lange, bis alles geklärt ist).
In einem speziellen Dialogmodus führen die Eingaben des Benutzers und die Kommentare des Systems zur Bildung längerer Dialoge, die als solche gespeichert werden können und als benutzerspezifisches „Lehrgesprächsprotokoll“ dienen. Anstelle eines Frage-Antwort-Dialogs kann man auch eine offenere Dialogform wählen, in welcher der Benutzer korrekte Aussagen zu einem allgemeinen Thema macht.
- Wenn im Sinn von summativen Tests verwendet, können statt der (oder zusätzlich zu den) Kommentaren punktemässige Bewertungen errechnet werden. Sie können sehr viel präziser sein als in traditionellen Auswahltests, denn die einzelnen Komponenten der Antwort werden einzeln bewertet, und zwar mit positiver oder negativer Gewichtung, und dann vom System zu einer Gesamtpunktzahl verrechnet.
Schauen Sie sich nun ein Beispiel eines Satzergänzungstests an.
