Die wahrnehmungspsychologischen Grundlagen des Filmemachens oder warum Menschen Filme verstehen

von Markus Huff

Fernsehen gehört zu den beliebtesten Freizeitbeschäftigungen. Aber wie sind wir überhaupt in der Lage dazu, Szenen, die jeweils nur für etwas mehr als eine Sekunde gezeigt werden, als zusammenhängende komplexe Handlung zu interpretieren? Haben wir besondere Fähigkeiten dafür entwickelt? Ein Blick auf die wahrnehmungspsychologische Forschung der letzten Jahre.

Wir verbringen im Schnitt fast vier Stunden täglich vor dem Fernsehen. Filme unterscheiden sich jedoch fundamental von natürlichen Wahrnehmungssituationen des Alltags (z. B. Spaziergang durch eine Fußgängerzone). Während im Alltag visuelle Informationen kontinuierlich verfügbar sind, wird die visuelle Wahrnehmung in Filmen alle drei bis fünf Sekunden durch einen filmischen Schnitt unterbrochen und wir sehen entweder dieselbe Szene aus einer anderen Perspektive oder eine ganz andere Szene. Trotz dieser Herausforderungen für unsere visuelle Wahrnehmung sind wir in der Lage, Filme zu verstehen und Handlungsstränge nachzuvollziehen. In diesem Beitrag stelle ich dar, welche kognitiven Verstehensprozesse dabei eine zentrale Rolle spielen und was wir von Filmen über die menschliche Kognition lernen können.

Von natürlicher Wahrnehmung zu Filmwahrnehmung

Obwohl wir im Alltag einem kontinuierlichen Strom an Sinneseindrücken ausgesetzt sind, nehmen wir einzelne, klar von einander abgrenzbare Ereignisse wahr. Ein Tag beginnt beispielweise mit dem Aufstehen, der Morgentoilette, dem Zubereiten des Frühstücks, dem Gang zum Briefkasten, dem Frühstück mit Zeitungslektüre, ... . Die Übergänge zwischen solchen Ereignissen werden als Ereignisgrenzen bezeichnet. Ereignisgrenzen sind wichtig für die menschliche Informationsverarbeitung. So beeinflussen Ereignisgrenzen unsere Aufmerksamkeit: Wir sind immer dann besonders aufmerksam, wenn ein Ereignis endet und ein neues Ereignis beginnt (Huff, Papenmeier & Zacks, 2012). Diese erhöhte Aufmerksamkeit wiederum führt zu einer tieferen Verarbeitung von Informationen an Ereignisgrenzen.

In seiner einfachsten Form wäre ein Film durchaus mit der natürlichen Wahrnehmung vergleichbar. Es gäbe hier nur eine einzige Kamera, die alles Geschehen in Echtzeit aufzeichnen würde. Und tatsächlich gibt es solche Filme. Alfred Hitchcocks „Cocktail für eine Leiche“ aus dem Jahr 1948 wurde beispielsweise mit nur einer Einstellung gefilmt. Dies ist jedoch nicht die Regel. In Filmen wird eine Handlung meist mit mehreren Kameras aufgezeichnet. Dies hat verschiedene Vorteile. Einer davon ist, dass man auch sehr komplexe Handlungen aufzeichnen kann, die zum Beispiel in einem Haus mit mehreren Zimmern spielen. So kann für jeden Teil einer Handlung eine optimale Perspektive gewählt werden. Eine solche optimale Perspektive wird in der Wahrnehmungspsychologie als „kanonisch“ bezeichnet. Ein zentrales Merkmal einer kanonischen Perspektive ist die Orthogonalität der Hauptbewegungsrichtung einer Handlung und der Blickrichtung der Kamera. In solchen Fällen werden die räumlichen Relationen unverzerrt aufgenommen (Garsoffky, Schwan & Huff, 2009). Beim Zielfoto eines 100 Meter Laufs werden durch diese Technik optische Verzerrungen verhindert (siehe Abbildung 1).

Die entstandenen Aufnahmen werden anschließend aneinander geschnitten. Es entsteht eine Abfolge von Einstellungen, ein Film. Dabei haben filmische Schnitte, je nachdem, was danach gezeigt wird, verschiedene Konsequenzen: Nach einem filmischen Schnitt wird die aktuelle Handlung aus einer neuen Perspektive gezeigt oder durch einen filmischen Schnitt wird die Handlung unterbrochen und es wird die gleiche Handlung zu einem späteren Zeitpunkt. Oder es wird zu einer anderen, parallel verlaufenden Handlung geschnitten. Unabhängig davon stellen filmische Schnitte eine Herausforderung für die visuelle und kognitive Verarbeitung dar. Nach jedem Schnitt müssen wir uns neu orientieren und die aktualisierten Informationen mit bereits vorhanden integrieren.

Sprinters as they cross the finish line during a race at the 2000 Sydney Paralympic Games von Australian Paralympic Committee via Wikimedia Commons (https://commons.wikimedia.org/wiki/File:141100_-_Athletics_track_finish_line_from_above_-_3b_-_2000_Sydney_race_photo.jpg), cc (https://creativecommons.org/licenses/by-sa/3.0/deed.en)

FilmemacherInnen haben sich schon relativ früh mit dieser Problematik beschäftigt und das sogenannte „Continuity Editing System“ entwickelt. Dieses besteht aus einer ganzen Reihe von Regeln und Anweisungen mit dem Ziel, Verwirrung bei FilmzuschauerInnen zu verhindern. Zentral ist dabei das 180° System. Dieses besagt, dass die Kameras immer nur auf einer Seite der Handlungsachse stehen sollten. In Abbildung 2 ist zu erkennen, dass die beiden Kameras, die das Auto von der gleichen Seite der Straße aus aufnehmen, zu ähnlichen Aufnahmen kommen. Rechts und links ist auf den beiden Aufnahmen gleich. Wechselt man aber die Straßenseite, stimmt diese räumliche Zuordnung nicht mehr. Die Hoffnung der FilmemacherInnen ist, dass wenn diese und weitere Regeln des Continuity Editing Systems beachtet werden, die eine filmische Erzählung trotz Filmschnitten kontinuierlich wirkt. Das Continuity Editing System scheint dieses Ziel gut zu erreichen. Wenn man Menschen bittet, beim Filme schauen auch auf die Filmschnitte zu achten und diese zu zählen, werden ungefähr 25 % davon übersehen (Smith & Henderson, 2010). Zwei Gründe könnten für diesen Effekt verantwortlich einen. Zum einen könnte es daran liegen, dass einige Filmschnitte mit den natürlichen Ereignisgrenzen einer Handlung korrespondieren, wodurch wir diese nicht als störend empfinden und sie deshalb nicht wahrnehmen. Zum anderen könnte die Kontinuität einer Handlung Filmschnitte weniger störend wirken lassen. Und in der Tat gibt es innerhalb des Continuity Editing System des Hollywood Kinos die Regel, dass ein filmischer Schnitt während einer Handlung platziert werden soll (Arijon, 1978).

Müssen wir „Filme schauen“ lernen?

Eine der zentralen Fragen beim Thema Filmverstehen ist die Frage, ob wir „Filme schauen“ lernen müssen. Gibt es eine „Filmsprache“, die wir uns wie eine gesprochene Sprache aneignen müssen, um Filme verstehen zu können? Die spannendste Art und Weise, dies zu untersuchen, ist zweifellos der Test, ob erwachsene Menschen, die noch nie in ihrem Leben einen Film gesehen haben, die filmischen Grundlagen verstehen. Stephan Schwan und Sermin Ildirar (2010) fanden solche FilmnovizInnen in dem kleinen türkischen Dorf Isparta. Sie erstellten ein Set von kurzen Filmclips und fragten die Einheimischen nach ihrer Interpretation. Es stellte sich heraus, dass die FilmnovizInnen vor allem bei einfachen filmischen Stilmitteln Probleme hatten. Wenn beispielsweise abwechselnd zwei in unterschiedliche Richtungen blickende Menschen gezeigt werden, interpretierten erfahrene FilmschauerInnen dies als „die beiden Menschen stehen sich gegenüber“, während FilmnovizInnen die beiden Einstellungen nicht miteinander in Verbindung bringen konnten. Diese einfachsten filmischen Stilmittel müssen also gelernt werden. Sobald jedoch eine Handlung erkennbar war (z. B. die Zubereitung eines Tees), zeigten die FilmnovizInnen trotz filmischer Schnitte keine Verständnisschwierigkeiten mehr.

Bild: Markus HuffMit filmerfahrenen UntersuchungsteilnehmerInnen untersuchten Joseph Magliano und Jeff Zacks (2011), wie die natürliche Wahrnehmung von Ereignisgrenzen mit der filmischen Segmentierung korrespondiert. Die Ereignisgrenzen wurden bestimmt, indem sie Versuchspersonen einen Hollywood Film anschauen ließen und diese baten, immer dann eine Taste zu drücken, wenn sie den Eindruck hatten, dass eine bedeutungsvolle Einheit endete und die nächste Einheit begann. Die Ergebnisse waren eindeutig. Nur Filmschnitte, die eine Handlung unterbrachen, wurden als eigenständige Ereignisgrenzen wahrgenommen. Wir sind also in der Lage, Filme trotz eigentlich störendender Filmschnitte wahrzunehmen. Eine kontinuierliche Handlung ist dafür zentral.

Als Zwischenfazit können wir festhalten, dass Erfahrung mit Filmen eine gewisse Rolle zu spielen scheint. Eine filmische Erzählung mit einer kontinuierlichen Handlung können jedoch auch Menschen verstehen, die noch nie einen Film gesehen haben.

Gibt es einen optimalen Film?

Es scheint also eine Passung von natürlicher Wahrnehmung und filmischer Gestaltung zu geben. Dabei stellt sich die Frage, ob es einen optimalen Film gibt. Lassen sich Filme so gestalten, dass sie für Menschen besonders einfach wahrgenommen und verstanden werden können? Wichtige Kriterien könnten dabei sein, wie viel Zeit zwischen zwei filmischen Schnitten vergeht (Einstellungslänge) und wie sehr sich die FilmemacherInnen an die tradierten Regeln des Continuity Editing halten.

Die Einstellungslänge als wichtiges filmisches Merkmal hat sich über die letzten Jahrzehnte in bemerkenswerter Art und Weise entwickelt. Während beispielsweise der Film „Mary“ von Alfred Hitchcock aus dem Jahr 1930 eine durchschnittliche Einstellungslänge von 14.2 Sekunden hat, beträgt diese in dem Film „Das Bourne Vermächtnis“ aus dem Jahr 2012 nur noch 1.6 Sekunden. Die ZuschauerInnen müssen sich also im Mittel alle 1.6 Sekunden neu orientieren. In dieser Zeit müssen sie den Bildinhalt erkennen und diesen mit der bisher gezeigten Handlung integrieren.

Wie funktioniert dieser basale Integrationsprozess? Werden tatsächlich alle Informationen vertieft kognitiv verarbeitet oder werden die Inhalte eher oberflächlich behandelt? Dan Levin und Dan Simons konnten in Laborexperimenten zeigen, dass Menschen nicht bemerken, wenn der Hauptdarsteller zwischen zwei Einstellungen ausgetauscht wird oder wenn eine der Protagonistinnen nach einem Filmschnitt plötzlich ein Halstuch trägt (Levin & Simons, 1997). Diese Ergebnisse zeigen eindrücklich, dass das visuelle Kurzzeitgedächtnis beschränkt ist. Andererseits scheinen diese Prozesse offenbar beim Filmverstehen eine untergeordnete Rolle zu spielen.

Und in der Tat machen sich viele FilmemacherInnen diese Tatsache zu Nutze. So können beispielsweise StuntWomen für gefährliche Handlungen eingesetzt werden, ohne dass die ZuschauerInnen dies groß bemerken würden. Dennoch gibt es etliche FilmzuschauerInnen, die sich die Filme wiederholt sehr genau anschauen und diese Fehler in Internetforen dokumentieren (z.B. http://www.moviemistakes.com/). Beispielsweise wird im Film „Stirb langsam - Ein guter Tag zum Sterben“ aus dem Jahr 2013 in einer Verfolgungsjagd das linke Frontlicht eines Vans beschädigt. In einer der folgenden Einstellungen ist jedoch das rechte Frontlicht des Vans beschädigt und das linke intakt.

Hat das Ausmaß, in dem sich die FilmemacherInnen an das Regelwerk des Continuity Editing halten, Einfluss darauf, wie gut ein Film von den ZuschauerInnen verstanden wird? Dies lässt sich mit Blickbewegungsmessungen untersuchen. Dabei wird aufgezeichnet, zu welchem Zeitpunkt die/der ZuschauerIn an welche Stelle auf dem Bildschirm schaut. Filip Germeys und Géry d’Ydewalle (2007) konnten mit dieser Technologie zeigen, dass die Blicke nach Schnitten, die sich an die 180° Regel halten, und nach Schnitten, die sich nicht an diese Regel halten, vergleichbar sind. Unabhängig von der Einhaltung der 180° Regel blicken die ZuschauerInnen an die Stelle der Szene, die am meisten Informationen bietet. Blickbewegungen, die auf Konfusion der ZuschauerInnen hinweisen würden, fanden die Autoren dagegen keine. Dieser Befund spiegelt schön die Befunde von Schwan und Ildirar (2010) wider. Die Handlung und damit der Informationsfluss sind wichtiger für die Wahrnehmung von Filmen als die Positionierung von Kameras.

Arri camera 35mm von KMJ via Wikimedia Commons (https://commons.wikimedia.org/wiki/File:35_mm_Filmkamera_02.png), cc (https://creativecommons.org/licenses/by-sa/3.0/deed.en)Dies mag für Dialoge oder zielgerichtete Handlungen, wie beispielsweise das Zubereiten eines Tees, gelten. Wie sieht es aber bei Handlungen aus, die von der räumlichen Beziehung der Personen leben und nur über zwei Einstellungen hinweg verstanden werden können? Bei Verfolgungsjagden beispielsweise sieht man meist nur ein Fahrzeug pro Einstellung, bevor das andere Fahrzeug in der nächsten Einstellung gezeigt wird. Woher wissen die ZuschauerInnen, dass sich diese Fahrzeuge verfolgen? Der/die ZuschauerIn muss erkennen, wie sich jedes einzelne Auto in Relation zu seiner filmischen Umwelt bewegt, und muss diese Information über filmische Schnitte hinweg integrieren. Nur so kann letztendlich der Eindruck entstehen, dass sich zwei Autos verfolgen. Bei den sehr kurzen Einstellungslängen (von zum Teil unter einer Sekunde) muss dies alles sehr schnell passieren. Und zwar wird dabei nicht unbedingt die filmische Umwelt als Referenz genommen, sondern die dynamisch räumliche Information auf dem abbildenden Bildschirm. Das heißt, fuhr ein Fahrzeug in der ersten Einstellung auf dem Bildschirm nach links und ein anderes Fahrzeug in der zweiten Einstellung ebenfalls, nahmen die meisten ZuschauerInnen dies als eine Verfolgungsjagd wahr. Fuhren die beiden Autos dagegen in unterschiedliche Richtungen auf dem Bildschirm, wurde dies nicht als Verfolgungsjagd wahrgenommen. Das heißt, die räumlichen Informationen der Fahrzeuge werden heuristisch verarbeitet (Huff & Schwan, 2012). Nur wenn die Umweltinformationen widersprüchliche Informationen lieferten, wenn durch Missachtung der 180° Regel beispielsweise ein Baum oder ein Haus plötzlich auf der anderen Straßenseite stand, wird diese heuristische Verarbeitung gestört und die ZuschauerInnen verarbeiteten die ihnen zur Verfügung stehenden Informationen in elaborierter Art und Weise.

Abschluss

Wie viel Informationen können Menschen verarbeiten, wenn ihnen diese in Häppchen mit jeweils nur 1.6 Sekunden Dauer dargeboten wird? Diese erstaunlich kurze Dauer reicht aus, um einen Spielfilm von der Komplexität eines Spionagethrillers zu verstehen. Dabei müssen nicht nur einfache visuelle dynamische Reize wahrgenommen, sondern auch komplexe Zusammenhänge über Filmschnitte hinweg begriffen werden. Aktuelle wahrnehmungspsychologische Forschung zeigt, dass die von den FilmemacherInnen entwickelten Regeln bezüglich der räumlichen Anordnung der Kameras und der zeitlichen Platzierung von filmischen Schnitten mit den wahrnehmungspsychologischen Grundlagen des Menschen korrespondieren. Dadurch wird die Integration von Informationen über Filmschnitte hinweg erleichtert.

Literatur

Arijon, D. (1978). Grammar of the film language. Los Angeles: Silman-James Press.

Garsoffky, B., Schwan, S. & Huff, M. (2009). Canonical views of dynamic scenes. Journal of Experimental Psychology: Human Perception & Performance, 35, 17–27.

Germeys, F. & D’Ydewalle, G. (2007). The psychology of film: perceiving beyond the cut. Psychological Research, 71, 458–466.

Huff, M., Papenmeier, F. & Zacks, J. M. (2012). Visual target detection is impaired at event boundaries. Visual Cognition, 20, 848–864.

Huff, M. & Schwan, S. (2012). Do not cross the line: Heuristic spatial updating in dynamic scenes. Psychonomic Bulletin and Review, 19, 1065–1072.

Levin, D. T. & Simons, D. J. (1997). Failure to detect changes to attended objects in motion pictures. Psychonomic Bulletin and Review, 4, 501–506.

Magliano, J. P. & Zacks, J. M. (2011). The impact of continuity editing in narrative film on event segmentation. Cognitive Science, 35, 1489–517.

Schwan, S. & Ildirar, S. (2010). Watching film for the first time: How adult viewers interpret perceptual discontinuities in film. Psychological Science, 21, 970–976.

Smith, T. J. & Henderson, J. M. (2008). Edit blindness: The relationship between attention and global change blindness in dynamic scenes. Journal of Eye Movement Research, 2, 1–17.

Ausgabe 2 2014 / Kognitionspsychologie im Alltag. Teil 1: Handlung und Wahrnehmung

Editorial zur Themenausgabe: „Von der Basis zur Anwendung: Kognitionspsychologie und ihre Bedeutung für den Alltag. Teil 1: Wahrnehmung und Handlung“

Das Potential unbewusster Wahrnehmung – Wer entscheidet, was wir (unbewusst) tun?