Zwar weise ich jegliche Couch-Assoziationen im Zusammenhang mit meinem Studium stets vehement von mir. Ich kann allerdings nicht leugnen, dass es durchaus ein paar Deppen in unseren Kreisen gibt, die beeindruckend viel Mühe investieren, den Ruf der Psychologie als ernstzunehmende Naturwissenschaft zu torpedieren. Manche davon unterrichten sogar Studierende. Aus naheliegenden Gründen werde ich euch keine Namen nennen, auch kein Geschlecht, keinen Berufsstand und kein Institut. Es reicht zu wissen, dass die betreffende Person ihr Wissen in Lehrveranstaltungen verbreiten kann. Eher zufällig als verpflichtend habe ich ein paar der Veranstaltungen besucht, und da eine Aussage gleich zu drei verschiedenen Gelegenheiten vorkam (mein Zähler läuft noch), konnte ich meinen Ärger darüber frisch halten.

Und weil das auch eine fabelhafte Chance ist, euch die Möglichkeiten und Grenzen des (f)MRTs aufzuzeigen – ihr wisst schon, der magische Apparat, der diese lustig bunten Bilder produziert, wenn das Gehirn irgendwas macht – schauen wir uns mal an, was denn da so frohen Mutes verkündet wurde.

Sogenannte bildgebende Verfahren ermöglichen uns einen Einblick in innere Organe, so auch das Gehirn. Mit einem MRT können wir strukturelle Bilder erhalten, die z.B. einen Tumor im Gewebe offenbaren. Ein fMRT dagegen (das f steht für Gefahr- ähh, ich meine, funktionell) ermöglicht Einblicke in die „Arbeit“ des Gehirns, kann also (in Grenzen, wie wir gleich sehen werden) die Aktivität in Hirngebieten wiedergeben. Nun kann man strukturelle und funktionelle Veränderungen mit gewissen Ereignissen verknüpfen und zum Beispiel die Unterschiede im Gehirn zwischen gesunden Frauen und magersüchtigen Frauen untersuchen. Wie schon in der verlinkten Review und auch dieser Studie (die kaum Unterschiede finden konnte) deutlich wird, liegen aber Welten zwischen der Diagnose eines Tumors und der Zuordnung von strukturellen/funktionellen Veränderungen zu z.B. einem Krankheitsbild. Ersteres bedeutet eine in der Regel mit bloßem Auge erkennbare, massive Veränderung des Gewebes. Zweiteres involviert winzige Unterschiede, die auf den ersten Blick kaum von den üblichen Abweichungen zu unterscheiden sind, die man sowieso von Mensch zu Mensch findet. Gerade auf Individuallevel muss man also vorsichtig sein, wenn man Aussagen treffen will.

Das hält den Dozenten (geschlechtsneutral verwendet) in unserem Beispiel aber nicht davon ab, die Aussage zu treffen: „Wir können einem Gehirn heute ansehen, ob es eine glückliche Kindheit hatte oder nicht.“

Ich muss an glückliche Kühe denken und wage zu widersprechen. Sehen wir uns an, wieso.

Wie macht das MRT so tiefgründige Bilder von mir?
Mal ehrlich. Kein Fotograf hat es bisher geschafft, mein Inneres so gut darzustellen.
Ich gebe zu, meine Witze waren schon mal besser, also machen wir fix weiter, allerdings nicht ohne die Sendung-mit-der-Maus-Musik im Kopf anzuschalten. Fertig? Okay, los geht’s.
Für meine Neuro-Klausur musste ich die Funktionsweise eines MRTs relativ detailliert wiedergeben können. Meine Beschreibung hier wird abgespeckter, weil wir gar nicht so viele Kleinigkeiten wissen müssen um zu verstehen, wo mögliche Probleme mit der Interpretation der Ergebnisse von MRT-Studien liegen (eigentlich müssen wir dafür gar nicht mal wssen, wie ein MRT funktioniert). Dennoch verstehe auch ich nur die Spitze des Eisbergs und somit deutlich weniger als z.B. ein Physiker oder ein Forscher, der regelmäßig Daten mit einem solchen Gerät erhebt. Es gibt verschiedene Gewichtungen und Berechnungen, die man anwenden kann, und welche Methodik adäquat ist, bestimmen Fragestellung und Experimentaldesign. Das sind Kompetenzen, die ich bestenfalls in rudimentärem Maße besitze; für die ausführliche Beurteilung der Aussagekraft einer Studie, die ein (f)MRT verwendet, sind sie allerdings unerlässlich. Die generelle Problematik zu der oben zitierten Aussage beginnt aber bereits viel früher und ist deutlich allgemeiner.
Die meisten wissen, dass ein MRT irgendwie mit Magneten zu tun hat. Es heißt ja schließlich auch Magnetresonanztomographie. Und dass es eine Röhre ist, die eng ist und Krach macht (die Röhre ohne Krach ist dann das CT). Außerdem muss man mit magnetischen Gegenständen in der Nähe eines solchen Monstrums ein bisschen aufpassen.

Das Magnetfeld, das in einem MRT herrscht, ist unfassbar stark. In dem zuvor verlinkten Video beträgt es 1.5 Tesla, was eine übliche Stärke in Medizin und Forschung ist. Auch 3 Tesla sind durchaus gängig, aber es gibt auch wahnwitzige Geräte mit – wie in diesem Fall – 9.4 Tesla. Mittlerweile wurden sogar noch stärkere Tomographen entwickelt. Zum Vergleich: Das Erdmagnetfeld hat in Mitteleuropa eine Stärke von 48 µT. Mikrotesla also. Das sind 0.000048 Tesla. Kleiner Unterschied.

Wozu brauchen wir so ein wahnsinnig starkes Magnetfeld? Nun, unser Körper besteht wenig überraschend aus Atomen und bei vielen davon handelt es sich um Wasserstoffatome. Solche Atome (nicht nur Wasserstoff, versteht sich) haben einen sogenannten Spin, trudeln also im Körper fröhlich vor sich hin. Was erklärt, warum wir mit Fug und Recht behaupten können, jemand „spinnt“, aber- ach, lassen wir das. Normalerweise sind die Drehachsen der Spins der einzelnen Atome ungeordnet, aber sie lassen sich in Reih und Glied bringen, wenn wir sie ein starkes Magnetfeld einbringen. Jetzt, wo wir die Spins schön geordnet haben, können wir sie durch gezielte Impulse auslenken. Danach kehren sie langsam in ihren Ausgangszustand zurück. Die Zeit, die sie dafür brauchen, ist je nach Gewebe unterschiedlich und daher können wir den unterschiedlich starken Signalen der unterschiedlich weit „zurückgekippten“ Spins Farbwerte zuordnen, wodurch sich das typische MRT-Bild ergibt. Es handelt sich also um ein errechnetes Bild des dargestellten Organs und ist keinesfalls mit einem Foto vergleichbar. So kann der Liquor, das Hirnwasser, je nach angewandter Technik schwarz oder weiß dargestellt werden, selbiges gilt natürlich auch für andere Gewebearten.

Um auch den Ort des Signals richtig zuordnen zu können, gibt es noch weitere Magnetfelder im Scanner, die eine Art magnetisches Gefälle entlang der Achsen einbauen. Das Signal variiert also an verschiedenen Orten des Scanners leicht, wodurch es sich, vergleichbar mit Koordinaten, an die richtige Körperstelle zurückverfolgen lässt. Schicht für Schicht des Körpers wird auf diese Art angeregt, was auch erklärt, warum eine einzelne Messung so lange dauern kann. Wir gehen nach der Salami-Taktik vor und können nicht mit einem Schlag den ganzen Körper erfassen.

Und was ist mit den lustig bunten Bildern aus dem fMRT?

Da wo’s leuchtet, ist das Gehirn aktiv – sagt man so schön. Wäre toll, wenn es so einfach wäre.

Zunächst einmal muss man sich klar machen, was wir da überhaupt messen. Wir sind in der glücklichen Lage, dass sauerstoffreiches Blut andere magnetische Eigenschaften hat als sauerstoffarmes Blut. Wenn ein Hirngebiet aktiver ist, wird mehr Sauerstoff angeliefert. Diese Unterschiede kann man natürlich messen, aber man muss stets im Hinterkopf behalten, dass man eben genau das erfasst: Den BOLD-Kontrast (blood oxygen level dependent), also den Sauerstoffgehalt des Blutes an einer gewissen Stelle. Das ist nicht zwingend mit der Hirnaktivität an diesem Ort gleichzusetzen, bzw. bedeutet nicht unbedingt, dass die Neurone an diesem Ort stärker feuern. Wir wollen aber nicht zu sehr meckern, denn eine Korrelation mit neuronaler Aktivität ist unbestreitbar.

Problematisch wird es eher beim experimentellen Design: Was vergleicht man womit? Wir messen schließlich keine absolute Aktivität, sondern immer nur das Signal einer Experimentalbedingung im Vergleich zu einer Kontrollbedingung. Wenn wir beispielsweise wissen wollen, welche Areale involviert sind, wenn wir menschliche Gesichter erkennen, dann reicht es nicht, dem Probanden ein paar Portraits vorzulegen. Eine geeignete Kontrollbedingung muss gefunden werden, denn wenn wir das Signal beim Betrachten der Gesichter mit dem Signal vergleichen, das wir erhalten, wenn der Proband entspannt mit geschlossenen Augen im Scanner liegt, dann finden wir relativ dazu natürlich auch die Aktivierung von Hirngebieten, die z.B. einfach nur fürs Sehen zuständig sind oder mit Aufmerksamkeitsprozessen beschäftigt sind. Eine gute Vergleichsaufgabe ist der Experimentalaufgabe also maximal ähnlich und es fehlt lediglich der Prozess, den wir untersuchen wollen. Für unsere Gesichteraufgabe wäre zum Beispiel das Betrachten von Gegenständen und tierischen Gesichtern gar keine schlechte Idee.

Vorausgesetzt natürlich, wir gehen von linearen Prozessen aus. Es kann genau so gut sein, dass das Betrachten von Gegenständen und das Betrachten von Gesichtern völlig unterschiedliche Netzwerke involviert, und dann vergleichen wir Äpfel mit Birnen ohne nennenswertes Ergebnis. Hinzu kommt, dass sich nicht alle Prozesse klar voneinander trennen lassen bzw. es keine geeignete Aufgabe dafür gibt. Zumindest keine, die sich im Scanner vernünftig durchführen ließe. Allein wenn eine Reaktion verlangt wird, wird es kritisch. Bewegung während eines Scans ist generell unerwünscht und produziert unsauberere Daten. Lassen wir aber jemanden in Reaktion auf einen bestimmten Reiz einen Knopf drücken und auf einen anderen Reiz hin nicht (oder einen anderen Knopf), dann besteht schon aufgrund der Unterschiedlichkeit der Reaktion ein Unterschied in der Hirnaktivität.

Die nächste Herausforderung liegt in der Verarbeitung der Daten selbst. Die Menge der erhaltenen Signale ist unvorstellbar groß; jedem Voxel (ein dreidimensionales Pixel – ihr wisst schon, die kleinen Kästchen, die man sieht, wenn man ein viel zu kleines Bild viel zu groß zieht) wird ein Wert zugeordnet. Und wenn ich zwei Bedingungen gegenüberstellen will, dann rechne ich hunderte von Vergleichen unter hunderten von Voxeln. Die sind alle nicht unabhängig voneinander und somit ist die Chance, dass ich völlig zufällig einen Effekt finde, der gar nicht da ist, irgendwann sehr hoch. Aufgrund dessen muss man für solche Fälle korrigieren. Das passiert nicht nur bei komplexen fMRT-Daten, sondern wird schon im ersten Semester gerechnet, wenn ich simple Reaktionszeiten z.B. mehrfach vom selben Probanden erhebe und untereinander vergleiche. Wenn ich allerdings zu konservativ korrigiere, dann muss ich aufgrund der vielen Vergleiche so viele Abstriche machen, dass ein tatsächlicher Effekt wiederum womöglich nicht „überlebt“. Dann stehe ich genau so blöd da, weil ich nicht mehr in der Lage bin, auch nur irgendein Ergebnis zu finden, obwohl es eigentlich „da“ ist.

Man muss in Methodik und Statistik also ziemlich findig sein, wobei es verschiedene Lösungsansätze gibt. Auch hier bietet sich natürlich das Potenzial für (logische) Fehler.
Das bedeutet alles keinesfalls, dass ein fMRT ein kompliziertes Hexenwerk wäre, was sowieso niemand versteht. Im Gegenteil ist das Grundprinzip sogar ziemlich leicht verständlich. Der Teufel liegt allerdings im Detail und all die kleinen Fallstricke erschweren eine Interpretation der Daten.
Wie immer stelle ich beim Schreiben dieser Zeilen fest, dass die Einwände relativ unspektakulär klingen. „Das kann doch alles gar nicht so viel ausmachen“, mag man sich denken. Gerade das Experimentaldesign hat aber einen großen Einfluss darauf, wie das Ergebnis am Ende aussieht. Das hat gar nichts mit Manipulation von Daten zu tun (meistens jedenfalls nicht), sondern hängt vielmehr damit zusammen, welche Fragen man stellt und ob man mit seinem Experiment überhaupt die Antwort darauf liefert, oder die Antworten auf eine völlig andere Frage erhält, ohne sich dessen bewusst zu sein.
Der alte Spielverderber: Korrelation vs. Kausalität
Wenn alle Stricke reißen, dann gibt es das Gegenargument, das immer zieht. Das meine ich sogar nicht mal ironisch; es ist ein verdammt wichtiger Punkt.

Hervorragend illustrieren kann man das anhand solcher Beispiele: Autismus und der Verkauf von Bio-Lebensmitteln hängen eng zusammen. Genau wie die menschliche Geburtenrate und die Anzahl brütender Storchenpaare. Oder Käsekonsum pro Kopf und Tod durch verheddern in Bettlaken.

Wenn man genug Sachen miteinander vergleicht, findet man irgendwann schon einen Zusammenhang, zumindest den Daten nach. Das bedeutet aber nicht, dass ein erhöhter Käsekonsum zu mehr Verhedderungen in Bettlaken führt. Es könnte auch andersherum sein und je mehr Leute sich in Bettlaken verheddern, desto mehr Käse wird gekauft – weil auf Beerdigungen von auf diese Art verstorbenen Leuten besonders gerne Käsehäppchen dargeboten werden. Oder es gibt eine Moderatorvariable, in diesem Falle vielleicht perfide Serienkiller, die nicht nur einen Fetisch dafür haben, Leute qualvoll in ihrem Bettzeug ersticken zu sehen, sondern auch tierisch darauf abfahren, während der Beobachtung eines solchen Events Käse in sich hineinzustopfen.

Oooooder, und das ist wohl viel wahrscheinlicher: Es gibt keinen Zusammenhang zwischen den beiden Ereignissen. Wir Menschen mögen zwar gerne Gründe und auch ich hänge gerne dem Gedanken nach, dass alles eine Ursache hat (die es dann zu finden gilt!), aber ob ich das nun eher schicksalhaft interpretiere („Das war vorbestimmt!“) oder mit zu viel forscherischem Ehrgeiz („Irgendwas muss das verursacht haben, wenn ich es lange genug zurückverfolge.“): Manchmal muss man eben akzeptieren, dass es sich bei manchen Korrelationen bloß um einen sehr humorvollen Zufall handelt. Zufall bedeutet eben auch, dass unwahrscheinliche Ereignisse manchmal eintreffen – bloß eben mit geringer Wahrscheinlichkeit.

In unserem Alltag stehen Ursache und Wirkung oft in engem Zusammenhang und es ist ohne Frage sehr nützlich zu erkennen, dass es jedes Mal weh tut, wenn ich auf die Herdplatte fasse und die heiße Herdplatte wohl auch der Grund für den folgenden Schmerz ist. Die oben genannten Beispiele bringen uns jedoch alle zum Lachen und zeigen uns, dass man Zusammenhänge spätestens ab einer gewissen Größenordnung bzw. Komplexität stets vorsichtig betrachten sollte. Witzigerweise (oder eher traurigerweise) vergessen manche Wissenschaftler das aber, wenn sie ihre Forschung interpretieren. Bei dem Käse und den Bettlaken ist der Vergleich so irrwitzig, dass die Unsinnigkeit sofort auffällt. Aber ein aufleuchtendes Hirngebiet im fMRT und eine durchgeführte Aufgabe des Probanden? Das klingt plausibel und das ist ja auch das, was man erwartet hat. Kein Wunder also, dass man sich da schon mal selbst auf den Leim gehen kann.

Ein fMRT ist immer nur korrelativ und kann somit derselben falschen Logik erliegen wie die Bettlaken und der Käse. Das ist auch der Grund, warum bildgebende Verfahren eben keine gleichwertige Alternative zu Tierversuchen darstellen, wie zum Beispiel von der PETA hier behauptet wird. Unabhängig vom ethischen Für und Wider: Wenn ich Läsionen, also Schädigungen, im Hirn eines Tieres setze und den Einfluss auf das Verhalten messe, ist das kausal. Wenn ich einem Menschen eine Aufgabe gebe und mir anschaue, wo es im fMRT relativ zu einer anderen Aufgabe „leuchtet“, ist das korrelativ. Das ist methodisch betrachtet eine völlig andere Güteklasse, die ganz andere Arten von Schlüssen zulässt.

Und es ist genau der Grund, warum wir einem Gehirn nicht ansehen können, ob es eine glückliche Kindheit hatte oder nicht. (Über die PETA habe ich sogar eine Brücke zu meiner anfänglichen Assoziation mit den glücklichen Kühen geschlagen.)

Spaß beiseite

Dabei ist das Thema an sich gar nicht witzig und verdient definitiv Beachtung. Diese Review von Glaser sammelt sämtliche Auswirkungen, die wir im Zusammenhang mit Missbrauch und Vernachlässigung im Gehirn vermuten können. Dass Missbrauch Veränderungen hervorruft, ist nicht von der Hand zu weisen. Ob es nun die direkten Folgen sind, die sich in der Struktur des Gehirns niederschlagen, ob es Verhalten und Kognitionen sind, die durch die schlechten Erfahrungen ausgelöst werden und wiederum ihre Spuren im Hirn hinterlassen, ob die richtigen Erlebnisse in sensiblen Perioden fehlen – das alles wissen wir nicht genau. Und selbst, wenn wir rein gar keine Indizien finden könnten, dass auch nur irgendetwas im Gehirn nach schrecklichen Erfahrungen in der Kindheit anders ist, wäre das selbstverständlich kein Grund, die Bemühungen einzuschränken, mit aller Macht etwas dagegen zu unternehmen.

Ich verstehe die Argumentation, die durch Aussagen wie „man kann einem Gehirn Missbrauch ansehen“ ermöglicht wird. Immer noch sind psychische Erkrankungen und z.B. durch Leid ausgelöste „seelische Verletzungen“ mit Stigmata versehen. Was man nicht sehen kann, das kann durchaus auch Anstellerei sein – haben wir es nicht alle schwer? Wenn man aber sagen kann, dass man tatsächlich im Gehirn was finden kann – dann kann niemand mehr etwas dagegen sagen. Dann bekommt die Sache plötzlich eine ganz andere Realität; durch eine Verletzung, die man wahrnehmen kann.

So lobenswert die Intention dahinter auch sein mag und so sehr das im Einzelfall vielleicht Erleichterung bringen mag – es ist auch gefährlich.
Wenn wir auch sagen können, dass Missbrauch Spuren hinterlässt – und das würde wohl so oder so kaum jemand bezweifeln – so können wir einem einzelnen Menschen nicht ansehen, ob seine Kindheit gut war oder nicht. Und wie auch? Kann nicht jeder selbst am besten entscheiden, ob er glücklich war oder nicht? Wie wäre es umgekehrt, wenn jemand nach seinem Empfinden gelitten hat, aber das Gehirn „glücklich“ aussieht? Wer hat dann Recht?
Am einfachsten bleibt es in dem Fall, den Menschen selbst zuzuhören. Versteht mich nicht falsch, ich stehe auf Gehirne und nackte Daten. Aber hier sind wir nicht so weit (wenn wir es überhaupt je sein können) und der moralische Rattenschwanz ist länger, als es auf den ersten Blick scheint.

Hängen bleiben sollte jedenfalls: Wenn ich weiß, dass es mit steigender Körpergröße wahrscheinlicher wird, dass Menschen gerne Zitroneneis mögen (und ja, das habe ich mir völlig frei und unpassend ausgedacht), dann kann ich auch bei einem Zwei-Meter-Kerl nicht sagen, dass er Zitroneneis mag. Ich kann höchstens vermuten, dass er wahrscheinlicher Zitroneneis mag als der Mann von 1,50 neben ihm. Aber ein sicheres Zeichen ist das nicht und ich kann mich immer noch fatal irren. Bloß, dass Zitroneneis ein deutlich harmloseres Thema ist als Missbrauch.

Wenn sich jedenfalls ein Mann im weißen Kittel vorne ans Pult stellt und behauptet, eine glückliche Kindheit könne man einem Gehirn ansehen – dann sträuben sich mir alle Nackenhaare. Der Kittel ist schon Symptom genug. Weder Hygiene noch Schutz irgendeiner anderen Art begründen es, in einer solchen Tracht in der Vorlesung aufzulaufen; es geht hier lediglich um Autorität und den Anklang von Expertentum, nichts weiter. Unter den Akademikern, speziell wenn es um Gesundheit wie Medizin und Psychologie geht, herrschen noch immer steile Hierarchien und eine gewisse Aura umgibt Autoritäten. Als Student muss ich mich ja auch darauf verlassen können, dass die Lehrinhalte korrekt und überprüft sind.

Und so sitzt die junge Generation, die später selbst einmal Forschung angemessen auswerten können muss und unter Umständen sogar deren Konsequenzen auf reale Patienten übertragen muss, vor einer Figur im weißen Kittel, die selbstbewusst die hier breit getretene Aussage tätigt. Die das Ablesen einer glücklichen Kindheit im Gehirn als erwiesene Sache postuliert.
Erst nach der dritten Äußerung dieser Art folgte das Eingeständnis, dass man das soooo drastisch zwar nicht genau sagen könne, aber …

Das lässt eine völlig überinterpretierte Korrelation wie eine bloße Lapalie wirken. So als sei das zwar ein wenig überspitzt gesagt, im Allgemeinen aber richtig. Davon ist es jedoch weit entfernt und ich sorge mich nicht nur um die Implikationen der Aussage selbst, sondern auch über das Wissenschaftsbild, das in diesem Zuge vermittelt wird. Kein Wunder, dass die Grenzen von MRT, EEG und Co. in den Medien regelmäßig überschätzt werden. Wissenschaftskommunikation beginnt im Hörsaal und wenn wir schon nicht die gesamte Bevölkerung mit einem methodischen Basiswissen ausstatten können, dann sollte zumindest der wissenschaftliche Nachwuchs sauber und halbwegs unfallfrei geschult werden.

Man darf gespannt sein, ob man diese grausige Veranstaltungsreihe meinem Gehirn später ansieht. Im Zweifel zumindest meinen Zähnen, wo der Zahnschmelz abgeknirscht ist.


Quellen und erwähnte Links in Reihenfolge des Erscheinens, Stand 20.06.2017

[1] einglasrotwein.blogspot.com – Der Psycho in der Familie – 14.05.2017
[2] Fuglset, T.S., Landrø, N. I., Reas, D. L., & Rø, Ø. (2016). Functional brain alterations in anorexia nervosa: a scoping review. Journal of Eating Disorders 4:32
[3] Fuglset, T. S., Endestad, T., Hilland, E., Bang, L., Tamnes, C. K., Landrø, N. I., & Rø, Ø. (2016). Brain volumes and regional cortical thickness in young females with anorexia nervosa. BMC Psychiatry, 16, 404.
[4] YouTube – Sendung mit der Maus Intro Extended – uploaded 12.04.2013
[5] YouTube – Dangers of MRI – uploaded 25.07.2010
[6] medGadget – 9.4 Tesla Monster MRI – 06.12.2007
[7] Wikipedia – Erdmagnetfeld
[8] Bermúdez, J. L. (2014). Cognitive Science: An Introduction to the Science of the Mind. Cambridge University Press.
[9] boingboing.net – Correlation between autism diagnosis and organic food sales – 01.01.2013
[10] Matthews, R. (2000), Der Storch bringt die Babys zur Welt(p = 0.008), Stochastik in der Schule 21 (2001) 2 S. 21-23, Übersetzung aus Teaching Statistics, 2000 (2), 36-38.
[11] tagesschau Faktenfinder – Umgang mit Statistiken. Alles Lüge oder was? – 26.05.2017
[12] peta.de – Tierfreie Test- und Forschungsmethoden: Einführung und Beispiele – Stand August 2013 
[13] Glaser, D. (2000). Child Abuse and Neglect and the Brain – A Review. J. Child Psychol. Psychiat 41(1):97-116.