Stichwort Diagnosekompetenzen: Wie gut können Lehrkräfte die Leistungen ihrer SchülerInnen einschätzen?

Hat Ihr Kind wieder einmal eine schlechte Note erhalten, obwohl es gut vorbereitet schien? Oder kennen Sie das aus Ihrer eigenen Schulzeit? Und stellt sich Ihnen da manchmal die Frage, wie fair die Notenvergabe der Lehrerin oder des Lehrers eigentlich ist? Mit der Frage, wie angemessen Lehrkräfte die Leistungen ihrer SchülerInnen beurteilen können, beschäftigen sich auch WissenschaftlerInnen intensiv, spätestens seit der Veröffentlichung der PISA-Ergebnisse im Jahr 2001. Erforscht wird dabei auch, ob manche SchülerInnen systematisch benachteiligt werden, etwa aufgrund ihrer familiären Herkunft.

Als Ende 2001 die Ergebnisse der internationalen Schulleistungsvergleichsstudie PISA (Programm for International Student Assessment) veröffentlicht wurden, schrieben Zeitschriften wie der Focus dem „Fehlen der diagnostischen Kompetenz“ von Lehrkräften eine Schlüsselrolle für das mittelmäßige Abschneiden deutscher SchülerInnen zu: „Deren [der Lehrkräfte] entscheidendes Manko, so entlarvte Pisa, ist die Unfähigkeit, die Schwächen ihrer Schüler zu erkennen“ (FOCUS Online, 2001). In der PISA-Studie hatten Hauptschullehrkräfte diejenigen SchülerInnen ihrer Klasse benennen sollen, die im Lesen deutlich schwächer waren als ihre MitschülerInnen und von denen man annehmen konnte, dass sie später ernsthafte Schwierigkeiten beim Übergang in den Beruf bekommen würden. Es zeigte sich, dass diese Aufgabe den LehrerInnen nicht sehr gut gelang: Sie erkannten einen Großteil der SchülerInnen nicht, die in den PISA-Lesetestaufgaben schwach abgeschnitten hatten (Artelt, Stanat, Schneider & Schiefele, 2001). Auch wenn die Ergebnisse vorsichtig interpretiert werden sollten, da die untersuchte LehrerInnenstichprobe nicht für die gesamte Lehrerschaft repräsentativ war[1], so war es dennoch ein wichtiger Befund, der auch in der Öffentlichkeit wahrgenommen wurde. Das Ergebnis wurde in vielen Tages- und Wochenzeitungen diskutiert. Und auch die spätere Bundesministerin für Bildung und Forschung, Annette Schavan, forderte mit den Worten „ohne Diagnose keine Therapie“ (TAZ Online, 2001) eine intensivere Vermittlung von Diagnosekompetenzen in der Lehramtsausbildung. Fast zwanzig Jahre nach der Veröffentlichung der ersten PISA-Ergebnisse möchten wir in diesem Beitrag einen Überblick geben über den aktuellen Forschungsstand zum Thema Diagnosekompetenzen von Lehrkräften.

Für die optimale Förderung von Kindern, benötigen Lehrkräfte Diagnosekompetenzen. Foto: coyot via pixabay (https://pixabay.com/de/schule-zeichnen-zeichnung-bildung-1974369/, CC: https://pixabay.com/de/service/license/).Für die optimale Förderung von Kindern, benötigen Lehrkräfte Diagnosekompetenzen. Foto: coyot via pixabay (https://pixabay.com/de/schule-zeichnen-zeichnung-bildung-1974369/, CC: https://pixabay.com/de/service/license/).

Forschung zur Urteilsgüte von Lehrkräften

Der Begriff Diagnosekompetenzen (oder diagnostische Kompetenzen) bezeichnet die Fähigkeiten von Lehrkräften, die Leistungen ihrer SchülerInnen – aber auch deren Lernmotivation, Leistungsangst und andere für die Schule relevante Merkmale – zutreffend beurteilen zu können. Zudem wird darunter auch die Fähigkeit der Lehrkräfte verstanden, die Schwierigkeit von Aufgaben angemessen einschätzen zu können. Wie exakt die Urteile von Lehrkräften ausfallen, untersuchen WissenschaftlerInnen, indem sie die Leistungen der SchülerInnen in Leistungstests mit den Leistungsbeurteilungen der Lehrkräfte vergleichen. Ähnlich kann auch die von den SchülerInnen berichtete Lernmotivation, Leistungsangst, etc. mit Lehrkräfteeinschätzungen abgeglichen werden. Dabei werden häufig verschiedene Gütemaße der Beurteilung verwendet. Einerseits wird geprüft, inwiefern Lehrkräfte die SchülerInnen ihrer Klasse in eine korrekte Rangreihe bringen können – ob sie also bspw. leistungsstärkere von leistungsschwächeren SchülerInnen unterscheiden können (sog. Rangkomponente der Diagnosekompetenzen). Andererseits wird bestimmt, wie zutreffend Lehrkräfte das Niveau der gesamten Schulklasse einschätzen können, d. h. dass sie bspw. sagen können, ob ihre Klasse im Vergleich zu anderen Klassen derselben Jahrgangsstufe durchschnittliche, unter- oder überdurchschnittliche Leistungen zeigt (sog. Niveaukomponente der Diagnosekompetenzen).

Empirische Studien, die sich mit der Güte von Leistungsbeurteilungen befassen, deuten darauf hin, dass es Lehrkräften typischerweise gut gelingt, die Leistungen der SchülerInnen ihrer Klasse in eine Rangreihe zu bringen (z. B. Südkamp, Kaiser & Möller, 2012). Sie können also recht zuverlässig einschätzen, wer die Matheasse oder die RechtschreibkönigInnen der Klasse sind und welche SchülerInnen eher Schwierigkeiten beim Rechnen und Schreiben haben. Hingegen wird das Leistungsniveau der Klasse mehrheitlich überschätzt (zusammenfassend: van Ophuysen, 2010). Dies gilt allerdings nicht für besonders leistungsstarke Schulklassen, etwa am Gymnasium, die von ihren Lehrkräften oft unterschätzt werden (z. B. Leucht, Tiffin-Richards, Vock, Pant & Köller, 2012).

Die Einschätzung des Leistungsniveaus ist für Lehrkräfte insbesondere deshalb schwierig, weil meist kein externer Maßstab zur Verfügung steht (Artelt, 2009). Denn es liegen nur für bZeugnisse. Foto: Eigentum der Autorin (Andrea Westphal).Zeugnisse. Foto: Eigentum der Autorin (Andrea Westphal).estimmte Fächer und ausgewählte Jahrgangsstufen Standards vor, die beschreiben, was SchülerInnen zu diesem Zeitpunkt in ihrer Schullaufbahn bereits wissen und können sollen. Daher orientieren sich Lehrkräfte bei der Bewertung von Schulleistungen häufig an den Leistungen der SchülerInnen in ihrer Schulklasse. Da Schulklassen ganz unterschiedlich leistungsstark sind, kann dieser klassenbezogene Bewertungsmaßstab leicht zu Fehleinschätzungen des Leistungsniveaus führen. Er wird deshalb auch als Achillesferse der Lehrkräftebeurteilung bezeichnet (Artelt, 2009). Wenn es um die Einschätzung des Leistungsniveaus der Schulklasse geht, wird auch ein Dilemma der Notengebung offensichtlich: Noten sollen helfen, die leistungsstärkeren SchülerInnen einer Klasse von den leistungsschwächeren SchülerInnen zu unterscheiden. Daher würde es auch keinen Sinn ergeben, wenn Lehrkräfte in einer leistungsstarken Klasse ausschließlich Bestnoten verteilen würden. De facto bekommt deshalb ein/e SchülerIn in einer eher leistungsschwachen Klasse bessere Noten, als er/sie in einer leistungsstärkeren Klasse für dieselbe Leistung erhalten würde. Diese Abhängigkeit der Notenvergabe vom mittleren Leistungsniveau der Klasse wird auch als Big-Fish-Little-Pond-Effekt (oder Fischteicheffekt) bezeichnet. Somit läuft das Ziel, zwischen SchülerInnen einer Klasse zu differenzieren, dem Ziel entgegen, zwischen Schulklassen zu differenzieren.

Werden bestimmte SchülerInnengruppen systematisch unter- oder überschätzt?

Wenn die Leistungseinschätzungen von LehrerInnen nicht immer zutreffend sind, stellt sich die Frage, wie es zu Fehlurteilen kommt und wovon sich Lehrkräfte bei ihren Einschätzungen leiten lassen. Kommen Fehlurteile eher zufällig zustande, oder sind es bestimmte Eigenschaften von SchülerInnen, die an sich nichts mit der schulischen Leistungsfähigkeit zu tun haben, die Lehrkräfte aber eher zu Fehlurteilen verleiten? Möglich wäre, dass Lehrkräfte Annahmen über bestimmte Personengruppen im Kopf haben – etwa, dass Mädchen besser schreiben und Jungen besser rechnen können – die zu systematisch verzerrten Leistungsbeurteilungen führen. In diesem Beispiel würden somit Mädchen bei der Notenvergabe in Deutsch und Jungen bei der Notenvergabe in Mathematik systematisch gegenüber dem jeweils anderen Geschlecht bevorzugt.

Tatsächlich sind die Leistungserwartungen von Lehrkräften teilweise von solchen Stereotypen geprägt. So trauen Lehrkräfte SchülerInnen aus einkommensstarken Familien offenbar höhere Leistungen zu als SchülerInnen aus einkommensschwachen Familien und haben für die sozial besser gestellten SchülerInnen positivere Lehrerin teilt SchülerInnen Noten mit. Foto: rawpixel via Pixabay (https://pixabay.com/de/aktivit%C3%A4t-brett-brainstorming-3408114/, CC: https://pixabay.com/de/service/license/).Lehrerin teilt SchülerInnen Noten mit. Foto: rawpixel via Pixabay (https://pixabay.com/de/aktivit%C3%A4t-brett-brainstorming-3408114/, CC: https://pixabay.com/de/service/license/).Zukunftserwartungen (Boone & van Houtte, 2013). In Studien in den USA konnte gezeigt werden, dass Lehrkräfte dort von SchülerInnen asiatischer Abstammung höhere Leistungen erwarten, während sie glauben, dass afroamerikanische SchülerInnen eher leistungsschwach sein werden (Tenenbaum & Ruck, 2007).

 Sind stereotype Beurteilungen zutreffend?

Solche stereotypen Erwartungen erscheinen auf den ersten Blick sehr ungerecht zu sein. Jedoch haben einige WissenschaftlerInnen die Frage aufgeworfen, ob die stereotypen Erwartungen der Lehrkräfte nicht auch ein Stück weit zutreffend sein könnten. So trägt ein Fachzeitschriftenartikel den provokativen Titel “The unbearable accuracy of stereotypes“ (zu Deutsch etwa: Die unerträgliche Genauigkeit von Stereotypen; Jussim, Cain, Crawford, Harber & Cohen, 2009). Die WissenschaftlerInnen argumentieren, dass die Erwartungen der Lehrkräfte sich aufgrund von Erfahrungen mit bestimmten Schülergruppen herausbilden. Bspw. könnten Lehrkräfte immer wieder erleben, dass SchülerInnen, deren Eltern AkademikerInnen sind, sehr gute Leistungen erzielen und deshalb in der Folge generell höhere Erwartungen an diese Schülergruppe entwickeln.




[1] Auf Repräsentativität war bei PISA bei der Auswahl der SchülerInnen- Stichprobe geachtet worden, was aber nicht zwingend bedeutet, dass auch deren LehrerInnen eine repräsentative Abbildung der Lehrerschaft darstellen.

AutorInnen

Facebook