Wien/Klagenfurt – Nicht entsprechend geschulte Lehrer sollten bei der Durchführung der Deutsch-Zentralmatura nicht eingesetzt werden. Zu diesem Schluss kommt eine Studie von zwei Wissenschaftern der Universität Klagenfurt. Ansonsten droht eine "instabile" Beurteilung, weil Lehrer die vorgegebenen Bewertungsraster unterschiedlich interpretieren.

Die Deutsch-Zentralmatura hat nicht nur einheitliche Aufgaben für alle Schüler gebracht, sondern auch eine neue Art der Bewertung in Richtung Kompetenzorientierung. Musste zuvor bei der Matura ein Aufsatz verfasst werden, dessen Beurteilung mehr oder weniger im Ermessen des auch aufgabenerstellenden Lehrers lag, liegen die Dinge nun komplizierter. Für die Klausur sind nun Kompetenzbereiche definiert, die von den Schülern nachgewiesen werden müssen – etwa Lesen, Argumentieren, Interpretieren.

Zu bearbeiten sind nun zwei Schreibaufgaben, die Arbeiten müssen bestimmten vorgegebenen "Textsorten" entsprechen, also ein Kommentar, ein Leserbrief oder ähnliches. Außerdem müssen in den Aufgaben enthaltene "Arbeitsaufträge" erfüllt werden.

Kein Abzählen mehr

Die Bewertung der Arbeiten erfolgt nicht durch das rein quantitative Zählen von Fehlern a la "zehn Rechtschreibfehler sind ein Fünfer", sondern qualitativ. Entscheidend ist dabei der Gesamteindruck des beurteilenden Lehrers, der wiederum einer Niveaustufe auf einer mehrstufigen Skala zugeordnet wird. Für die Beurteilung wichtig ist dabei natürlich die Interpretation dieser Skala und der dort verwendeten Formulierungen. Wenn die Beschreibung einer (den Noten entsprechenden) Niveaustufe von unterschiedlichen Lehrern unterschiedlich interpretiert wird, entstehen ungewollte Zufallseffekte bei der Benotung – die gleiche Arbeit würde dann eventuell unterschiedlich bewertet.

Für ihre Studie legten Günther Sigott und Hermann Cesnik im Jänner 2012 (also noch einige Zeit vor dem österreichweiten Start der Zentralmatura) 150 ungeschulten Oberstufenlehrern 76 bei der Beurteilung vorgegebene sogenannte Deskriptoren vor – das sind einzelne Beschreibungen von Niveaustufen wie "leicht nachvollziehbare Binnengliederung", "kohärent und frei von Gedankensprüngen", "variantenreiche und komplexe, der Textsorte angemessene Satzstrukturen", "überwiegend grammatikalisch korrekt", "weitgehend grammatikalisch korrekt" "grammatikalisch nahezu fehlerfrei" etc. Die Reihenfolge der einzelnen Deskriptoren wurde dabei verändert, um innerhalb eines Bewertungsfelds wie etwa Grammatik nicht die vorgegebene Notenfolge von eins bis fünf zu suggerieren.

Die Lehrer mussten sich nun einen Maturanten vorstellen, der gerade noch einen Vierer bekommt und für jeden der 76 Deskriptoren auf einer achtstufigen Skala angeben, wie schwierig es für diesen Maturanten ist, dem jeweiligen Deskriptor gerecht zu werden – also etwa ob es für ihn "sehr einfach" (1) bis "sehr schwierig" (8) ist, einen "grammatikalisch nahezu fehlerfreien" Text zu schreiben.

Unterschiedliche Maßstäbe

Resultat: Die Lehrer legten durchaus unterschiedliche Maßstäbe an. "Die Ergebnisse zeigen, dass die Schulung der Beurteilenden zur Erhöhung der Übereinstimmung unumgänglich ist. Eine Verwendung der Skala durch nicht Geschulte ist nicht ratsam", so Sigott in einer Aussendung.

Einzelne Deskriptoren erwiesen sich als wenig stabil – die Lehrer schwankten in ihrer Interpretation. Interessant: Am stärksten war dies beim unteren Leistungsniveau der Fall. Hingegen konnten die Forscher feststellen, dass "es ein hohes Maß an Konsens über die erwarteten Charakteristika von exzellenter Leistung zu geben scheint". (APA, 28.2.2017)