Wer wird denn nun bei den Noten benachteiligt – Mädchen oder Jungen?

Schulnoten geben nicht nur SchülerInnen Rückmeldung über ihren aktuellen Leistungsstand, sie bestimmen auch die Chancen auf Studienplätze sowie den Erfolg von Bewerbungen. Die Frage, ob Lehrkräfte unabhängig vom Geschlecht bewerten, ist daher sehr wichtig. Traditionell stehen beim Thema Geschlechterfairness meist Benachteiligungen von Mädchen im Vordergrund. In den letzten Jahrzehnten wurde in den Medien jedoch viel diskutiert, ob das Schulsystem Jungen benachteilige. Dieser Artikel fasst den Stand der Forschung, ob Schulleistungen von Mädchen und Jungen unterschiedlich benotet werden, zusammen.Bild 1: Schulnoten sind wichtig für den Erfolg – wie fair sind sie? Bild 1: Schulnoten sind wichtig für den Erfolg – wie fair sind sie?

Der Kampf für Gleichberechtigung und Gleichbehandlung der Geschlechter ist traditionell geprägt vom Bestreben, Benachteiligungen von Frauen und Mädchen abzubauen. Aktuell verdienen Frauen im Durchschnitt immer noch weniger und haben seltener gesellschaftliche Machtpositionen als Männer. Traditionellen Geschlechterrollen entsprechend gelten Männer als kompetenter, Frauen hingegen als wärmer im sozialen Sinne (Eckes, 2002). Beeinflussen solche Stereotype (d.h. allgemeine Annahmen über Gruppen) womöglich bereits die Noten in der Schule, so dass Mädchen, basierend auf geringeren Erwartungen von Kompetenz, als systematisch schlechter bewertet werden?

In den Medien sind in den letzten Jahrzehnten allerdings eher Beiträge zu finden, die nahe legen, dass unser Bildungssystem Jungen massiv benachteilige und diese inzwischen die eigentlichen Bildungsverlierer seien. Eine große internationale Metaanalyse (d.h. eine Zusammenfassung vieler Studien) bestätigt, dass Mädchen im Durchschnitt etwas bessere Schulnoten bekommen (Voyer & Voyer, 2014). Heißt das also, dass Lehrkräfte Jungen bei der Notengebung benachteiligen?

Sieht man sich Geschlechterstereotype in Bezug auf die Fähigkeiten genauer an, wird klar, dass beide möglichen Vorhersagen wohl nach Schulfach differenziert werden müssen. Hohe Fähigkeiten werden Jungen vor allem im mathematisch-naturwissenschaftlichen Bereich zugeschrieben. Sprachliche Fähigkeiten, zum Beispiel Lesekompetenz, werden hingegen eher bei Mädchen vermutet. Beeinflussen diese Annahmen über Geschlechtergruppen also die Benotung von einzelnen SchülerInnen abhängig vom Fach?

In diesem Artikel soll es deshalb um die Frage gehen, ob Mädchen und Jungen für die gleiche Leistung unterschiedliche Noten bekommen. Es geht dagegen nicht um die Frage, ob Mädchen oder Jungen tatsächlich unterschiedliche Fähigkeiten haben. Stereotype über die Geschlechter können auf realen oder eingebildeten durchschnittlichen Unterschieden beruhen; so oder so sollten Lehrkräfte jede individuelle Leistung bewerten, ohne sich von stereotypen Erwartungen beeinflussen zu lassen. Grundsätzlich ist anzunehmen, dass die Mehrheit der Lehrkräfte bestrebt ist, alle Schülerinnen und Schüler fair zu behandeln und bei der Bewertung mit gleichem Maß zu messen. Doch das Verteilen fairer Noten ist keine einfache Aufgabe – es bestehen oft Ermessensspielräume. Dadurch können auch mit entsprechender Ausbildung und Erfahrung unbewusste, stereotype Erwartungen und äußere Merkmale das Urteil beeinflussen. Die Frage, die an dieser Stelle beantwortet werden soll, ist: Gibt es wissenschaftliche Erkenntnisse darüber, ob Schulleistungen je nach Geschlecht des Schulkindes unterschiedlich bewertet werden, und wenn ja, werden Mädchen oder Jungen benachteiligt?

Bild 2: Mädchen bekommen bessere Noten und bleiben seltener sitzen als JungenBild 2: Mädchen bekommen bessere Noten und bleiben seltener sitzen als Jungen

Was spricht dafür, dass Mädchen schlechter bewertet werden?

In einer Reihe von Experimenten wurde direkt untersucht, ob Mädchen und Jungen für die gleiche Leistung unterschiedliche Noten bekommen: Lehrkräften wurden ein oder mehrere Schularbeiten zur Korrektur vorgelegt. Bei der Hälfte der Lehrkräfte stand ein männlicher, bei der anderen Hälfte ein weiblicher Name über derselben Arbeit. Im Anschluss wurden die Noten verglichen. Da sich die Schularbeiten nur im Geschlecht der AutorInnen unterschieden, können systematische Unterschiede in der Bewertung ausschließlich darauf zurückzuführen sein. Die Schularbeiten bestanden dabei aus durchschnittlichen Aufsätzen oder Erklärungen aus dem mathematisch-naturwissenschaftlichen Leistungsbereich. Die meisten der Studien dieser Art deuten darauf hin, dass Arbeiten von vermeintlichen Mädchen schlechter bewertet wurden als von vermeintlichen Jungen, vor allem wenn die Lehrkräfte noch wenig Erfahrung hatten (Hofer, 2015; Spear, 1984).

Weitere Studien beschäftigten sich bereits vor über 30 Jahren in ähnlicher Weise mit Texten im außerschulischen Kontext. Auch hier fand man, dass identische Aufsätze von weiblichen Autorinnen in Bereichen, die nicht als typisch weiblich gelten, ein bisschen schlechter eingeschätzt wurden als die von männlichen Autoren (Swim, Borgida, Maruyama & Myers, 1989).

Berechtigterweise muss man jedoch die Frage stellen, ob diese Befunde auch heute noch aktuell sind. Schließlich ist ein großer Teil dieser Studien schon mehrere Jahrzehnte alt. Die erwähnte Studie von Hofer ist die einzige, die darauf hindeutet, indem sie die Benachteiligung von Mädchen in Physik auch noch im Jahr 2015 zeigte.Bild 3: Die meisten Machtpositionen werden von Männern gehaltenBild 3: Die meisten Machtpositionen werden von Männern gehalten

Geht man von den klassischen Geschlechterstereotypen aus, wäre außerdem plausibel anzunehmen, dass Jungen in Mädchendomänen (z. B. im sprachlichen Bereich), ebenfalls schlechter benotet werden. Es mangelt jedoch an experimentellen Studien zu dieser Frage.

Was spricht dafür, dass Jungen schlechter bewertet werden?

Experimente wie die oben genannten haben den Vorteil, dass sie direkt den kausalen Effekt des Geschlechts zeigen können und andere Einflüsse auf die Note sorgfältig ausschließen. Dafür betreffen sie meist eher spezifische und kleinere Stichproben von einzelnen Bewertungen. Eine andere Art von Studien greift auf tatsächliche SchülerInnendaten aus repräsentativen Datensätzen zurück. Dabei werden die Noten, die Lehrkräfte in der Schule vergeben haben, mit objektiven Schulleistungstests in Zusammenhang gebracht.

Generell ist dabei auffällig, dass der größere Erfolg der Mädchen in der Schule sich nicht durchgängig durch einen vergleichbar größeren Erfolg bei Leistungstests wie PISA abzeichnet. Da solche Leistungstests ohne Kenntnis des Geschlechts standardisiert ausgewertet werden, können sie herangezogen werden, um zu überprüfen ob Schülerinnen und Schüler des gleichen Leistungsniveaus gleiche Noten von Lehrkräften bekommen. So kann zwar nicht direkt ein kausaler Zusammenhang des Geschlechts überprüft werden, aber indirekt auf die Rolle des Schülergeschlechts für Noten geschlossen werden – über andere wichtige Einflussfaktoren hinaus.

Auswertungen einer Reihe von großen Datensätzen aus verschiedenen westlichen Ländern zeigen, dass bei Berücksichtigung der objektiven Schulleistung Mädchen in Mathematik und zum Teil auch in anderen Fächern bessere Noten als Jungen erhielten (z. B. Cornwell, Mustard & Van Parys, 2013; Lindahl, 2016). Insofern kann daraus auf die Benachteiligung von Jungen geschlossen werden. Dies ist auf den ersten Blick überraschend, da Mathematik als stereotyp männliche Domäne gilt. Die Unterschiede in der Benotung sind allerdings offenbar vor allem dadurch zu erklären, dass Lehrkräfte bei der Benotung auch das Verhalten (z. B. die Mitarbeit, Lernstrategien) mit einbeziehen, und dass sie Mädchen – dem Stereotyp entsprechend – als fleißiger, motivierter und braver wahrnehmen (Cornwell u. a., 2013).

Der zwiespältige Bonus für die Mitarbeit von Mädchen

Doch ganz so leicht lässt sich das Argument der Bevorzugung von Mädchen nicht aufrechterhalten: Eine Neuanalyse des Datensatzes von Cornwell und Kollegen (2013) bestätigte, dass Lehrkräfte in die Leistungsbewertung in Mathematik das Lernverhalten mit miteinbeziehen. Dieses schätzen sie bei Mädchen besser ein, so dass sie bei gleicher Testleistung bessere Noten bekommen als Jungen. Wenn aber Mädchen und Jungen mit gleicher objektiver Testleistung und gleichem Verhalten verglichen wurden, bekamen die Mädchen schlechtere Mathenoten als die Jungen (Robinson-Cimpian, Lubienski, Ganley & Copur-Gencturk, 2014; s. auch Kuhl & Hannover, 2012).

Die Lehrkräfte hielten Mädchen zudem für weniger mathematisch kompetent, obwohl sie ihnen bessere Noten gaben. Je weniger Kompetenz die Lehrkräfte den Mädchen zuschrieben, umso mehr fielen deren Leistungen hinter die von Jungen zurück. Die AutorInnen verweisen in diesem Zusammenhang darauf, dass die Erfolge von Mädchen häufig mit ihrem Verhalten begründet würden, aber nicht mit ihren Fähigkeiten. Dies führe langfristig dazu, dass Mädchen sich weniger zutrauen (Robinson-Cimpian u. a., 2014).

Im sprachlichen Bereich, der als typisch weibliche Domäne gilt, scheinen Mädchen wie in Mathematik bei gleicher Leistung bessere Noten zu bekommen als Jungen. Die Noten unterscheiden sich aber nicht, wenn das Verhalten durch die Lehrkräfte gleich eingeschätzt wurde (Kuhl & Hannover, 2012).

Es ist natürlich möglich, dass auch die Wahrnehmung des Lernverhaltens durch Stereotype beeinflusst sein kann, dass Jungen also als fauler wahrgenommen werden, als sie es sind. In jedem Fall besteht Grund zur Annahme, dass fachbezogene oder verhaltensbezogene Stereotype von Lehrkräften auch schädlich für Jungen sein können. Zum Beispiel können stereotyp niedrige Erwartungen von Lehrkräften in Bezug auf die Lesekompetenz sich in der Selbsteinschätzung von Jungen niederschlagen und so ihre spätere Leistung beeinträchtigen (Wolter, Braun & Hannover, 2015).

Messen mit unterschiedlichem Maß in bester Absicht?

Stereotype Erwartungen wirken im Übrigen nicht immer als Vorurteil, sondern manchmal auch als Vergleichsmaßstab. Zum Beispiel könnte die Fähigkeit eines Mädchens mit einer mittelmäßigen Matheleistung oder die eines Jungen mit einer mittelmäßigen Leseleistung als „gut“ bewertet werden. Unausgesprochen wäre jedoch „gut für ein Mädchen/für einen Jungen“ gemeint.

In einem Experiment dazu sollten zukünftige Lehrkräfte einschätzen, wie gut ein fiktiver Schüler bzw. eine Schülerin in einem Test abgeschnitten hatte (Holder & Kessels, 2017). Über den/die SchülerIn wussten sie nur das Geschlecht und dass er/sie auf Grundlage eines zuvor abgelegten Tests auf einem mittleren Kompetenzniveau eingeordnet worden war (z. B. anhand von Kriterien wie „kann fehlende Zahlen in Reihen meist identifizieren“). Die StudienteilnehmerInnen sollten nun einschätzen, wie der/die SchülerIn in dem Test abgeschnitten hatte. Wenn der Test als standardisierter Leistungstest beschrieben wurde, wurde bei Mädchen im Vergleich zu Jungen eine geringere Punktzahl vermutet. Lehrkräfte vermuteten also rückwirkend, dass gleiche vorliegende Kompetenzeinschätzungen von Mädchen und Jungen unterschiedliche objektive Leistungsfähigkeit widerspiegeln würden. Wenn der Test dagegen eine eher subjektiv zu bewertende Sammlung von Arbeiten (ein Lernportfolio) war, schätzen die Lehrkräfte das Abschneiden von Mädchen und Jungen gleich gut ein. Die vermuteten Geschlechterunterschiede bei dem objektiven Test verschwanden also bei dem Test mit mehr Ermessensspielraum. Anscheinend vermuten Lehramtsstudierende also, dass Ermessenspielraum bei einem Test genutzt würde, um Mädchen im Vergleich zu Jungen mit einem großzügigeren Maß zu bewerten.

Es liegt nahe anzunehmen, dass Lehrkräfte gerne fair bewerten wollen und motiviert sind, ungleiche Möglichkeiten der Geschlechter zu verringern. Wenn Ermessenspielraum besteht, könnten sie bei dem vermeintlich benachteiligten Geschlecht – bewusst oder unbewusst – niedrigere Bewertungsstandards verwenden. Mit dieser Interpretation lässt sich womöglich erklären, warum Fähigkeiten von Mädchen in Mathematik zwar als schlechter eingeschätzt werden, sie aber trotzdem bessere Noten bekommen als Jungen (Robinson-Cimpian u. a., 2014). Wenn in die Note auch das subjektive Unterrichtsverhalten einfließt, ergibt sich ein Ermessenspielraum, der genutzt werden könnte, um Ungleichheiten zu kompensieren. Ein Beispiel dazu: Eine Lehrkraft, schätzt Mädchen als weniger kompetent in Mathematik ein, nimmt sie aber im Unterricht als motivierter und fleißiger wahr. Wenn sie nun einen Test ohne Wissen über das Unterrichtsvorhalten benoten muss, würde sie vielleicht den Test des Mädchens schlechter bewerten als den des Jungen (wie in experimentellen Studien gefunden). Bei der Vergabe von Noten in der Schule würde die Lehrkraft vielleicht Leistung und Verhalten subjektiv verrechnen. Dies würde bei gleicher objektiver Leistung in besseren Noten für Mädchen resultieren (wie in den großen Datensatzanalysen gefunden). Ob dieser Erklärungsansatz zutrifft, muss jedoch in weiteren Studien überprüft werden.

Fazit

Wissenschaftlich betrachtet sind in Bezug auf die ungleiche Bewertung der Leistungen von Mädchen oder Jungen noch einige Fragen offen. Insgesamt deuten die Ergebnisse aber darauf hin, dass Mädchen nach wie vor als weniger kompetent in Mathematik eingeschätzt werden. Sie werden zwar besser als Jungen benotet, wenn das Unterrichtsverhalten miteinfließt, was natürlich zunächst den Jungen schadet. Werden jedoch Mädchen und Jungen mit gleichem Verhalten verglichen, werden die Leistungen von Mädchen im mathematisch-naturwissenschaftlichen Bereich schlechter bewertet als die von Jungen, was langfristig Mädchen schadet und Geschlechterunterschiede verschärft.

In stereotyp weiblichen Fächern wie Sprachen bekommen Jungen schlechtere Noten als Mädchen, auch bei gleicher Leistung. Es fehlen Studien, die genauer untersuchen, welche Rolle stereotype Fähigkeits- und Verhaltenseinschätzungen dabei spielen.

Insgesamt ist das Stereotyp, dass Mädchen fleißiger, motivierter und angepasster in der Schule sind, für beide Geschlechter problematisch. Neben den beschriebenen versteckten Kosten für Mädchen kann es Jungen verunsichern und ihre Leistungsfähigkeit einschränken (Hartley & Sutton, 2013). Bekannt ist auch, dass stereotype Erwartungen von Lehrkräften in Bezug auf Fähigkeiten sich in der Motivation der Jungen langfristig niederschlagen (Wolter u. a., 2015). Alle Ungleichbehandlungen scheinen in den klassischen Geschlechterstereotypen über typische Fähigkeiten und Verhaltensweisen begründet zu liegen, ob sie nun Mädchen oder Jungen benachteiligen.

Wie kann ungleiche Bewertung vermieden werden?

Was sich grundsätzlich in allen Studien zeigte ist, dass ungleiche Bewertungen aufgrund des Geschlechts auftraten, wenn entsprechender Ermessensspielraum vorlag. Dieser kann darin bestehen, dass bei der Bewertung eines Aufsatzes nicht eindeutig festgelegt ist, welche Kriterien in welcher Gewichtung zu bewerten sind. Er kann auch darin bestehen, dass Aspekte jenseits der eigentlichen Leistung, zum Beispiel das Lernverhalten, beliebig berücksichtigt werden. Gibt es dagegen von Vornherein genau festgelegte und eindeutig gewichtete Bewertungskriterien, besteht wenig Spielraum für Beeinflussung durch alle potentiellen Fehlerquellen, wie zum Beispiel das Geschlecht.

Die Bewertung ohne Kenntnis des Geschlechts wäre vielleicht auch ein Weg. Dieser stößt jedoch vermutlich in der Schulpraxis an seine Grenzen, wo die Handschrift und Ausdrucksweise oft für die Lehrkraft erkennbar sind.

Darüber hinaus wäre es wichtig, Lehrkräfte so auszubilden, dass sie stereotype Erwartungen weniger an die SchülerInnen weitergeben und nicht in die Bewertung einfließen lassen. Dies schließt keineswegs aus zu überlegen, welche Unterrichtsformen und -materialien den typischen Vorlieben und Eigenschaften von Jungen und Mädchen gerecht würden und das Repertoire entsprechend zu erweitern. Doch im Umgang mit Individuen können stereotype Erwartungen – von den schwierigen Jungen und fleißigen Mädchen, den ungleich verteilten mathematischen und sprachlichen Fähigkeiten – schädlich sein, sowohl für Jungen als auch für Mädchen.

 

Literaturverzeichnis

Cornwell, C., Mustard, D. B., & Van Parys, J. (2013). Noncognitive skills and the gender disparities in test scores and teacher assessments: evidence from primary school. Journal of Human Resources, 48(1), 236–264. https://doi.org/10.3368/jhr.48.1.236
Eckes, T. (2002). Paternalistic and envious gender stereotypes: testing predictions from the Stereotype Content Model. Sex Roles, 47(3), 99–114. https://doi.org/10.1023/A:1021020920715
Hartley, B. L., & Sutton, R. M. (2013). A stereotype threat account of boys’ academic underachievement. Child Development, 84(5), 1716–1733. https://doi.org/10.1111/cdev.12079
Hofer, S. I. (2015). Studying gender bias in physics grading: the role of teaching experience and country. International Journal of Science Education, 37(17), 2879–2905. https://doi.org/10.1080/09500693.2015.1114190
Holder, K., & Kessels, U. (2017). Gender and ethnic stereotypes in student teachers’ judgments: a new look from a shifting standards perspective. Social Psychology of Education, 20(3), 471–490. https://doi.org/10.1007/s11218-017-9384-z
Kuhl, P., & Hannover, B. (2012). Differenzielle Benotungen von Mädchen und Jungen. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 44(3), 153–162. https://doi.org/10.1026/0049-8637/a000066
Lindahl, E. (2016). Are teacher assessments biased? – evidence from Sweden. Education Economics, 24(2), 224–238. https://doi.org/10.1080/09645292.2015.1014882
Robinson-Cimpian, J. P., Lubienski, S. T., Ganley, C. M., & Copur-Gencturk, Y. (2014). Teachers’ perceptions of students’ mathematics proficiency may exacerbate early gender gaps in achievement. Developmental Psychology, 50(4), 1262–1281. https://doi.org/10.1037/a0035073
Spear, M. G. (1984). Sex bias in science teachers’ ratings of work and pupil characteristics. European Journal of Science Education, 6(4), 369–377. https://doi.org/10.1080/0140528840060407
Swim, J., Borgida, E., Maruyama, G., & Myers, D. G. (1989). Joan McKay versus John McKay: Do gender stereotypes bias evaluations? Psychological Bulletin, 105(3), 409–429. https://doi.org/10.1037/0033-2909.105.3.409
Voyer, D., & Voyer, S. D. (2014). Gender differences in scholastic achievement: a meta-analysis. Psychological Bulletin, 140(4), 1174–1204. https://doi.org/10.1037/a0036620
Wolter, I., Braun, E., & Hannover, B. (2015). Reading is for girls!? The negative impact of preschool teachers’ traditional gender role attitudes on boys’ reading related motivation and skills. Frontiers in Psychology, 6, 1267. https://doi.org/10.3389/fpsyg.2015.01267

 

Bildquellen

Bild 1: https://www.flickr.com/photos/dirkvorderstrasse/18879265103; © Dirk Vorderstraße, CC Lizenz mit Namensnennung

Bild 2: https://www.flickr.com/photos/66536212@N07/6992640202/; © Woodapple (CC Lizenz mit Namensnennung)

Bild 3: https://commons.wikimedia.org/wiki/File%3AHeads_of_the_2014_G-20_member_... © Agência Brasil; CC Lizenz mit Namensnennung

Autor*innen

Artikelschlagwörter