Mehr Beweise für eine schmerzbezogene Beschreibung von dACC

[Hinweis: Bitte lesen Sie den dritten Absatz, der die Ursache für Verwirrung über unser Papier aufklärt]

Seit unserer letzten Blog-Antwort auf Tal Yarkoni (TY) gab es drei neue Antworten von TY, Tor Wager (TW) und Alex Shackman (AS). Diese Antworten haben uns eine Menge Anlass zum Nachdenken gegeben und uns veranlasst, zusätzliche Analysen durchzuführen, die wir (Lieberman & Eisenberger, im Folgenden L & E) für die Klärung, Erweiterung und letztlich Stärkung unserer ursprünglichen Ansprüche halten. Während wir zu allen Analysen im PNAS-Papier stehen, wünschen wir uns, dass wir diese Analysen vorher geplant und in das Papier aufgenommen haben.

In einigen der neuesten Blogs stimmen wir nicht überein, aber da wir daran interessiert sind, voranzukommen, wollen wir wieder mit Bereichen beginnen, in denen es Übereinstimmung zu geben scheint, und dann zu unseren neuen Analysen übergehen zu einer Diskussion von vier Themen: (a) Das Verhältnis von Schmerz und Angst in der Neurosynth-Datenbank (b) Informieren uns z-Scores in Neurosynth über umgekehrte Inferenz? (c) Empirische Priors und (d) Können wir jemals sagen, dass eine Region des Gehirns eine Funktion hat? Wir möchten klarstellen, dass dieser Blog unser letzter Kommentar zu all dem sein wird. Zwischen dem vorherigen Post und diesem haben wir das Gefühl, dass wir alles geklärt haben, was wir tun müssen, um zu zeigen, dass unsere Schlussfolgerungen gut sind. Wir gehen davon aus, dass diejenigen, die bereits Beiträge geschrieben haben, uns weiterhin widersprechen werden, aber wir hoffen, dass andere dies nützlich finden.

Bevor wir jedoch in den Haupttext dieses Blogs eingingen, wollten wir einen wichtigen Punkt klären, der später in diesem Blog näher erläutert wird. Aus den Analysen in unserem PNAS-Papier gehen wir nicht davon aus, dass, wenn wir dACC-Aktivität sehen, dies notwendigerweise bedeutet, dass die Person Schmerzen hat . Um diese Behauptung zu erstellen, müsste man Posterior-Wahrscheinlichkeiten basierend auf realen empirischen Prioren erzeugen, die nicht existieren (weder der Neurosynth vor 0.50 oder die 3.5% Prävalenz von Schmerz in Neurosynth Abstracts liefern diese Information, da letztere reflektiert, was ist studiert häufig, nicht was allgemein häufig vorkommt). Aber das war nicht die Art von Behauptung, die wir machten. Unsere Behauptung war viel einfacher: Es gibt zuverlässige Beweise basierend auf Z-Scores von reversen Inferenzkarten, dass Schmerz mit einem Großteil der dACC assoziiert ist . Im Gegensatz dazu gibt es in den meisten dACCs viel weniger Evidenz, die auf Z-Scores von Reverse-Inferenz-Maps basiert, dass exekutive, Konflikt- und Salienzprozesse zuverlässig mit dACC assoziiert sind . Diese Ergebnisse legen nahe, dass ein Bericht über die dACC-Funktion sich mehr auf Schmerzprozesse als auf kognitive Prozesse konzentrieren sollte. Unser Anspruch besteht darin, die beste Darstellung der dACC-Funktion zu erstellen, den in einer bestimmten Studie vorhandenen Prozess nicht vorherzusagen oder anzunehmen, dass jedes dACC-Neuron dasselbe tut. Im Folgenden betrachten wir mehrere zusätzliche Accounts der dACC-Funktion, um diesen Anspruch umfassender zu machen.

Bereiche der Übereinstimmung

Obwohl TY darauf hinweist, dass er mit fast allem, was wir in unserem ersten Blog gesagt haben, nicht einverstanden ist, pfeffert er auch seinen neuesten Blogeintrag mit Zitaten von uns oder Neuformulierungen von Behauptungen von uns, mit denen er ausdrücklich einverstanden ist (oder kein Problem damit hat). Wir sind der Meinung, dass dies hervorzuheben ist, da wir der Meinung sind, dass dies einige der wichtigsten Behauptungen unseres Artikels sind.

Wir schrieben: "Die Schlussfolgerung aus den Neurosynth Reverse Inference Maps ist eindeutig: Der dACC ist an der Schmerzverarbeitung beteiligt. Wenn nur Vorwärtsinferenzdaten verfügbar waren, war es vernünftig, die Behauptung zu erheben, dass dACC vielleicht nicht an Schmerzen per se beteiligt war, sondern dass die Schmerzverarbeitung auf die "echte" Funktion des dACC reduziert werden konnte, wie Exekutive Prozesse, Konflikterkennung oder Salienzreaktionen auf schmerzhafte Reize. Die umgekehrten Inferenzkarten unterstützen keine dieser Konten, die versuchen, den Schmerz auf allgemeinere kognitive Prozesse zu reduzieren. "

TY schrieb als Antwort: "Dieser Anspruch erscheint mir in der Tat weitgehend unbedenklich."

Wir haben geschrieben: "Für die Begriffe Exekutive und Konflikt zeigt unsere Abbildung 3 im PNAS-Papier ein winziges Stück dACC. Wir denken, dass die umfassenderen Zahlen, die wir hier aufgenommen haben, weiterhin die gleiche Geschichte erzählen. Wenn jemand die Konfliktgeschichte darüber erzählen möchte, warum Schmerz die dACC aktiviert, sollten unserer Meinung nach weit verbreitete robuste Reverse-Inferenz-Mappings von der dACC zu Konflikten vorliegen. Aber die Beweise für eine solche Behauptung sind einfach nicht da. Was auch immer Sie über den Rest unserer Statistiken und Behauptungen denken, dies sollte viele Leute dazu bringen, innezuhalten, denn das ist nicht das, was fast jeder von uns in diesen umgekehrten Inferenzkarten erwartet hätte (einschließlich uns). "

TY schrieb als Antwort: "Keine Einwände hier"

Es gab auch andere paraphrasierende Beispiele für Übereinstimmung. Zum Beispiel schrieb TY:

Und "Wenn L & E mich gefragt hätte, hey, glaubst du, dass Neurosynth unterstützt, zu sagen, dass die dACC-Aktivierung ein guter Marker für 'Salienz' ist?", Hätte ich "nein, natürlich nicht" gesagt.

Und in einem separaten Abschnitt schrieb er:

"Wenn, was sie meinen, ist ungefähr wie" im Durchschnitt, den Durchschnitt aller voxels in dACC nehmend, gibt es mehr Beweise einer statistischen Verbindung zwischen Schmerz und dACC als Schmerz und Konfliktüberwachung "dann bin ich damit einverstanden." [Anmerkung : Wir nehmen an, dass der letzte Satz falsch geschrieben ist und dass TY "Konfliktüberwachung und dACC" bedeutet.]

Angesichts der Tatsache, dass all diese Behauptungen, bei denen Übereinstimmung besteht, davon abhängen, dass die von Neurosynth bereitgestellten Z-Score-Karten als Beweis (oder Fehlen von Beweisen) interpretieren, dass ein Begriff ein vernünftiges umgekehrtes Inferenzziel ist, nehmen wir als wichtige Bereiche der Übereinstimmung Folgendes an:

  1. Z-Scores von Neurosynth liefern Hinweise darauf, ob bestimmte Voxel über eine reverse Inferenz einer bestimmten Funktion plausibel zugeordnet werden können. Es kann mehrere Begriffe geben, die signifikante Z-Werte für ein Voxel zeigen, und alle diese Ausdrücke sind plausible Funktionen, die diesem Voxel zugeordnet werden können.
  2. Aus den z-Werten der Rückwärtsinterferenzen gibt es kaum Hinweise darauf, dass Exekutiv-, Konflikt- und Salienzprozesse gute Reverse-Inference-Ziele für die dACC-Aktivierung sind. Beachten Sie, dass wir "kleine", nicht "keine" Beweise sagen, genau wie wir es in unserer Arbeit getan haben, da es einige dACC-umgekehrte Beweise für Konflikte gibt, aber es ist bescheiden.
  3. Es gibt Hinweise aus Z-Scores, dass Schmerzprozesse gute Rückschlussziele für einen großen Teil von dACC-Voxeln sind.

Wenn wir uns auf diese Punkte einigen können, denke ich, dass wir dem größten Teil dessen, was uns in unserer Arbeit wichtig ist, zustimmen.

Neue Neurosynth-Analysen

Die letzte Aussage von TY ("Wenn sie meinen, dass etwas wie … ist") ließ uns erkennen, dass es einen anderen Weg gab, um den Schlussfolgerungen zu begegnen, die wir im PNAS-Papier erreicht hatten. Wie wir bereits sagten, war ein Teil dessen, was uns erschreckte, als wir uns vor einigen Jahren die umgekehrten Inferenzkarten für Schmerz, Exekutive, Konflikt und Salienz ansahen, wie verbreitet die dACC-Berichterstattung im Hinblick auf Schmerz im Vergleich zu den anderen Begriffen war. Wir haben versucht, dies zu erfassen, indem wir uns 8 Voxel ansehen, die über den dACC verteilt sind. Vielleicht war dies nicht der beste Weg, um zu quantifizieren, was wir sahen, und es war nicht sensibel für zwei vernünftige Probleme, die von TY und AS aufgeworfen wurden. Zuerst haben wir uns nur die Mittellinie angesehen, ein Thema, das von TY erwähnt wurde. Zweitens haben wir unsere dACC-Grenzen mit einem nicht-probabilistischen Atlas definiert und konnten daher nicht darauf hinweisen, dass es sich bei den betrachteten Voxeln tatsächlich um dACC-Voxel handelt, was von AS aufgeworfen wurde.

Was wir in unseren neuen Analysen getan haben, ist eine dACC-Maske unter Verwendung des Harvard-Oxford probabilistischen Atlasses (im Folgenden HO) und dann der Prozentsatz von Voxeln im dACC, für die verschiedene Terme ein vernünftiges umgekehrtes Inferenzziel basierend auf der Neurosynth-Reverse-Inferenz sind Karten. Um den HO-Atlas zu erstellen, nahmen sie T1-gewichtete Bilder von Dutzenden von Gehirnen (bit.ly/1RMTAzp). Verschiedene Regionen von Interesse (z. B. ACC) wurden vor jeder Transformation an einzelnen Gehirnen identifiziert. Dann wurde jeder Scan im MNI-Raum registriert. An diesem Punkt konnten sie für jeden Voxel im MNI-Raum bestimmen, wie viele einzelne Gehirne im ersten Schritt mit einem bestimmten Label markiert wurden. Wenn also 75% der Gehirne eine bestimmte Koordinate tragen würden, die als ACC bezeichnet wird, würde dieses Voxel mit einer 75% igen Wahrscheinlichkeit, ACC zu sein, in jedem neuen Scan, der im MNI-Bereich registriert ist, bewertet werden.

Matthew Lieberman
Quelle: Matthew Lieberman

Mit diesem Atlas konnten wir dACC – Masken (-8 ≤ x ≤ 8; 0 ≤ y ≤ 30) definieren, für die die Voxel 25%, 35%, 50% oder 75% wahrscheinlich in der dACC waren (siehe Abbildung) über). Man könnte argumentieren, dass nur Voxel, die mindestens 50% oder 75% wahrscheinlich dACC – Voxel sind, in unsere ROIs eingehen sollten, aber die visuelle Inspektion ergab, dass diese ROI – Masken sehr ähnlich aussahen wie im PNAS – Papier Antwort von AS, also gingen wir mit einer liberaleren 35% -Maske für unsere hier vorgestellten Analysen.

Beachten Sie, dass die Ergebnisse in allen Masken qualitativ identisch sind. Der einzige wesentliche Unterschied, den wir beobachten konnten, war, dass der Anteil der dACC-Voxel, die über eine Rückschlussfolgerung mit affektiven Termen assoziiert waren (z. B. Schmerz +9), von dOCC-Masken mit niedrigerem Vertrauen (25%) zu dCCM-Masken mit höherem Vertrauen (75%) wechselte %, Angst + 12%, negativer Affekt + 6%) und der Anteil der mit kognitiven Begriffen assoziierten dACC-Voxel sank (zB Konflikt -12%; Fehler -6%). Wenn wir also unsere Gewissheit erhöhen, dass ein bestimmtes Voxel tatsächlich in der dACC ist, ist es wahrscheinlicher, dass es mit einem affektiven Prozess assoziiert ist und weniger wahrscheinlich mit einem kognitiven Prozess assoziiert ist. Um es anders auszudrücken, die Voxel, die mit kognitiven Prozessen in der dACC assoziiert sind, tendieren dazu, die Voxel zu sein, die wir am wenigsten vertrauen sollten, sind tatsächlich in der dACC.

Die unten dargestellten Analysen verwenden alle die 35% -Maske. Wir dachten zunächst daran, unsere vier Hauptkategorien des Interesses an dem PNAS-Papier (Schmerz, Exekutive, Konflikt, Salienz) zusammen mit denen, die von TY als Alternativen in Betracht gezogen wurden, zu betrachten (Angst, Autonomie, Belohnung). Letztendlich haben wir beschlossen, mehr Begriffe in unsere Analysen aufzunehmen, damit wir den von TY in seinem neuesten Blog angegebenen Standard für Selektivität erfüllen können:

"Man kann sagen, dass eine Hirnregion für eine bestimmte Funktion" selektiv "ist, wenn sie (i) eine robuste Assoziation mit dieser Funktion zeigt, (ii) eine vernachlässigbare Assoziation mit allen anderen leicht verfügbaren Alternativen zeigt und (iii) die Autoren haben mit Sorgfalt vorgegangen, um sicherzustellen, dass die wichtigsten in der Literatur vorgeschlagenen Kandidatenfunktionen in ihrer Analyse gut vertreten sind. "

Wir denken, dass diese Definition über die Art hinausgeht, in der viele Forscher diesen Begriff in der Vergangenheit verwendet haben (zB in MVPA-Papieren), aber wir dachten, dass es sich lohnen würde zu sehen, was passiert, wenn wir diese Definition auf unsere Analysen anwenden. Wir sollten beachten, dass wir das Wort "Assoziation" in dieser Definition so interpretieren, dass es sich nur auf Assoziationen bezieht, die in den reversen Inferenzkarten identifiziert wurden, und nicht in den Forward-Inferenzkarten. Daher haben wir versucht, unsere Sorgfaltspflicht zu erfüllen, um sicherzustellen, dass die wichtigsten in der Literatur vorgeschlagenen Kandidatenfunktionen in ihrer Analyse gut vertreten sind. So haben wir jetzt eine Liste von 14 Begriffen, die jeden dACC-Account abdecken, von dem wir im Laufe der Jahre wissen. Unsere Liste der Begriffe beinhaltet:

Schmerz, Aufmerksamkeit, Autonomic, Vermeidung, Konflikt, Emotion, Fehler, Exekutive, Angst, negativer Affekt, Response Inhibition, Response Selection, Belohnung und Salience.

Wir glauben, dass dies eine ziemlich umfassende Liste von Begriffen ist, und hoffen, dass sie, wenn wir welche verpasst haben, ein vernünftiges Synonym für die Liste haben, die wahrscheinlich ähnliche Auswirkungen haben wird.

Auf zu den Analysen. Das erste, was wir getan haben, war eine Zählung der Anzahl der Voxel in der 35% -Maske durchzuführen. Es gab 1110 Voxel, von denen der HO-Atlas mindestens 35% sicher war, dass sie dACC-Voxel waren. Von diesen erscheinen 947 Voxel (oder 85,3%) in der umgekehrten Inferenzkarte für Schmerz (unter Verwendung des Standard-Neurosynth-Signifikanzniveaus von p <0,01, FDR korrigiert). Von den 13 anderen Termen bezog keiner mehr als 20% der dACC-Voxel (siehe Abbildung unten). Der Chi-Quadrat-Vergleich zwischen Schmerz und jedem anderen Begriff war hochsignifikant. Alle X 2 > 975,278, ps <0,00001, ds> 5,38. Diese sagen uns, dass der Schmerz viel häufiger eine Umkehrschlussfolgerung Erklärung über dACC Voxel als jeder der 13 anderen Begriffe ist.

Matthew Lieberman
Zeigt den Prozentsatz der dACC-Voxel an, die in der umgekehrten Inferenzkarte jedes Terms erscheinen. Dasselbe Voxel kann in der Karte für mehrere Begriffe erscheinen
Quelle: Matthew Lieberman

Die obige Analyse kommt nicht zum Kern des Selektivitätsproblems, wie es in der Definition von TY charakterisiert ist, da das gleiche Voxel für mehrere Terme erscheinen kann und somit nicht die Selektivität eines Terms gegenüber anderen angibt. Daher haben wir als nächstes untersucht, wie viele Voxel in der dACC selektiv für irgendwas aussahen, so dass sie für die umgekehrte Inferenzkarte eines Terms auftraten, aber in keiner der anderen 13 Terme mit umgekehrten Inferenzkarten auftraten. Man könnte sich vorstellen, dass mit 14 Termen, dass fast keine Voxel in der dACC durch diese Definition Selektivität zeigen würden – jedes Voxel, das für nur zwei der Terme signifikant ist, wird aus dieser Analyse eliminiert. Trotz der hohen Hürde für die Selektivität erschienen hier 477 Voxel von den 1110 (43%) in der dACC in nur einer der 14 Umkehrinferenzkarten. Diese 477 Voxel scheinen dann die durch die Definition von TY festgelegte Selektivität zu erfüllen. Von den 477 dACC-Voxeln, die selektiv für einen einzelnen Begriff sind (von den 14 berücksichtigten Begriffen), waren 91,2% selektiv für den Begriff Schmerz .

Matthew Lieberman
Von dACC-Voxeln, die für 1 von 14 Begriffen selektiv sind, wird der Prozentsatz für jeden Begriff angezeigt.
Quelle: Matthew Lieberman

Insgesamt waren 435 der 477 selektiven Voxel nur in der Schmerz-Reverse-Inferenz-Karte und nicht in irgendeiner der Rückwärts-Inferenz-Karten für die anderen 13 Terme vorhanden. Der einzige andere Begriff, der> 10 selektive Voxel hatte, war eine Belohnung von 30 Voxeln (wir haben das in der Originalarbeit angedeutet). Die Angst liegt als nächstes bei 8 Voxeln, mit einem Fehler bei 3 Voxeln und einem Konflikt bei 1 Voxel. Schmerzselektive dACC-Voxel sind mehr als eine Größenordnung häufiger als jeder andere selektive dACC-Voxel-Typ. Der Chi-Quadrat-Vergleich von Schmerz und irgendeinem anderen Ausdruck für die Anzahl an selektiven Voxeln in der dACC war hochsignifikant. Alle X 2 > 446.203, p's <.00001, ds> 1.64. Diese Ergebnisse zeigen uns, dass bei dACC-Voxeln, die Anzeichen für Selektivität zeigen, die Wahrscheinlichkeit, dass sie mit Schmerzen verbunden sind, viel höher ist als bei allen anderen 13 Begriffen.

Zwei sehr wichtige Vorbehalte hier:

1) Da 477 Voxel für einen Ausdruck selektiv waren, bedeutet dies, dass 633 dACC-Voxel für keinen Ausdruck selektiv waren. Obwohl wir der Meinung sind, dass wir hier einen sehr hohen Balken für die Selektivität verwenden, höher als in der Literatur, ist es klar, dass mit diesem hohen Balken weniger als die Hälfte der dACC-Voxel Selektivität zeigen. Aus dieser Perspektive ist es eine Übertreibung zu sagen, dass "die DACC" für alle anderen 13 Konten der dACC-Funktion, die wir derzeit in Betracht ziehen, einheitlich selektiv für Schmerz ist. Zwei Antworten auf diesen Vorbehalt. Erstens waren 823 Voxel unter Verwendung der vier Begriffe, die wir ursprünglich in Betracht gezogen hatten (Schmerz, Exekutive, Konflikt und Salienz), selektiv unter der gegenwärtigen Definition (dh 74,1% der dACC – Voxel) und davon waren 811 selektiv für Schmerz 98,5% der selektiven Voxel). Im Kontext der in unserem PNAS-Papier berücksichtigten Kategorien war unser Anspruch der Selektivität für Schmerz im Vergleich zu Exekutiv-, Konflikt- und Salienzprozessen angemessen. Zweitens, angesichts all der Antworten, die wir über den dACC als zu allgemein oder facettenreich gesehen haben, halten wir es für ziemlich beeindruckend, dass fast die Hälfte der dACC-Voxel selektiv sind und von diesen sind fast alle selektiv für Schmerzen.

2) Man könnte sich diese Analysen ansehen und denken, dass es nicht fair ist, jeden Begriff mit dem anderen 13 zu vergleichen, weil einige davon sich in überlappenden Kategorien befinden. Zum Beispiel haben wir Konflikt und Fehler einbezogen, die unterschiedliche, aber überlappende Konten von dACC sind. Wenn sie in den gleichen Voxeln wie sie erscheinen würden, würden sie diese Voxel aus der obigen Selektivitätsanalyse herausschlagen. Um dies anzugehen, haben wir unten eine Abbildung, die den Vergleich der Karten für Schmerz und jeden anderen Ausdruck zeigt – so kann jeder Ausdruck zeigen, wie viele Voxel für seine umgekehrte Inferenzkarte, aber nicht für die Schmerzen angezeigt werden. Die orangefarbenen Balken in jedem Paar mit den zwei Balken unten zeigen den Prozentsatz der dACC-Voxel, die jedem Ausdruck zugeordnet sind, wenn nur die Schmerz-assoziierten Voxel entfernt werden. Begriffe wie Fehler und Konflikt treten hier also nicht gegeneinander an. (Die blauen Balken zeigen an, wie viele Voxel in der umgekehrten Inferenzkarte des Schmerzes angezeigt werden, aber nicht für den anderen Ausdruck im Vergleich)

Matthew Lieberman
Quelle: Matthew Lieberman

Wie ersichtlich ist, zeigt diese Analyse keinen anderen Begriff, der besonders gut ist, wenn er 1-gegen-1 gegen Schmerzen eingesetzt wird. Abgesehen von der Belohnung, für die 2,7% der dACC-Voxel in der Karte, aber nicht in der Karte des Schmerzes erscheinen, erreicht kein anderer Begriff über 1,1%. Im Gegensatz dazu erreicht der Schmerz bei diesen Analysen konsistent über 65% aller dACC-Voxel, nachdem diese für einen anderen Begriff entfernt wurden. Während wir im PNAS-Papier darauf hingewiesen haben, dass Belohnung tatsächlich stärkere Effekte als Schmerzen im anteroventralen Teil von dACC zeigt, dachten wir, dass es sich lohnt, dies etwas deutlicher zu zeigen. Wenn wir eine abgewinkelte Grenze (gestrichelte grüne Linie) verwendet hätten, wie einige andere, um dACC von rACC zu unterscheiden, könnte die Rückwärtsinferenzkarte der Belohnung in dACC weitgehend fehlen. Es ist ziemlich klar in dieser Figur, dass der Rückschluss-Effekt für die Belohnung größtenteils Teil eines rostraleren ACC-Clusters ist.

Matthew Lieberman
Quelle: Matthew Lieberman

Die Schlussfolgerungen aus unseren aktuellen Analysen bestätigen den allgemeinen Punkt, der im PNAS-Papier formuliert wurde. Wenn wir über die Funktion von dACC sprechen, wie es zahllose Artikel in den letzten 20 Jahren getan haben, ist Schmerz die einzige Funktion, für die der dACC selektiv für mehr als eine Handvoll Voxel erscheint. Wir haben TYs Definition von Selektivität verwendet (unter der Annahme, dass Assoziation sich auf umgekehrte Inferenzassoziation bezieht). Daher haben wir versucht, eine erschöpfendere Liste von Begriffen zu erstellen, die vernünftige Konten von dACC darstellen. Wir bestimmten, welcher Prozentsatz der dACC-Voxel eine Rückwärtsinferenzverbindung mit jedem der 14 Terme zeigte. Wir bestimmten dann von diesen Voxeln, wie viele nur eine umgekehrte Inferenz-Assoziation mit einem Term und keinem der anderen 13 Terme zeigten. Um unsere Ergebnisse zusammenzufassen:

  1. Von den 1110 dACC-Voxeln erfüllten 43% (dh 477 Voxel) die obigen Selektivitätskriterien (die nur in einer der 14 Umkehrinferenzkarten auftraten).
  2. Von den 477 Voxeln, die selektiv waren, waren 91,2% (dh 435 Voxel) selektiv für Schmerz.
  3. Somit kann ein beträchtlicher Teil der dACC durch einen einzigen Ausdruck aus dieser großen Liste von historisch plausiblen Begriffen beschrieben werden.
  4. Von dem beträchtlichen Teil von dACC-Voxeln, die durch einen einzigen Ausdruck aus dieser langen Liste von vernünftigen Konten beschrieben werden können, erscheinen fast alle von diesen in der umgekehrten Inferenzkarte für Schmerz und für keinen der anderen 13 Begriffe.

Schmerz und Angst

Wir haben argumentiert, dass Distress-bezogener Affekt die Hauptursache für dACC-Prozesse sein könnte, wobei der dACC die Distress-bezogenen Aspekte des Schmerzes behandelt (Rainville et al. 1997). Jahrzehnte alte Läsionsarbeit legt nahe, dass der dACC eine Schlüsselrolle in der Not von körperlichen Schmerzen sowie in Angstzuständen spielt (Foltz & White, 1962; Tow & Whitty, 1953). Wie bereits erwähnt, gibt es eine nicht-triviale Anzahl von dACC-Voxeln, die in der umgekehrten Inferenzkarte aus Angst auftauchen (12,2% in unserer dACC-Maske). Wir glauben, dass Schmerz und Angst konzeptuell miteinander verwandt sind, da das meiste von dem, was wir fürchten, Dinge sind, die uns (physisch, sozial oder emotional) Schmerzen bereiten könnten. Aber im Zusammenhang mit Neurosynth ist die Beziehung viel direkter. Viele neuroimaging Studien der Angst sind Angst konditionierende Studien, die Schmerz (zB Schock) als unkonditionierten Stimulus verwenden. Diese Studien verwenden fast nie das Wort "Schmerz" und sind daher nicht für Schmerzen in Neurosynth markiert, sondern können aus Angst Angst-spezifische Effekte in die Rückschluss-Karten einbringen.

Um diese Möglichkeit zu untersuchen, haben wir die ersten 50 fMRI-Studien, die in Neurosynth für den Begriff Angst erscheinen, manuell untersucht. Wir fanden heraus, dass 50% dieser Studien Schmerzmanipulationen verwendeten. Um zu sehen, ob diese Schmerzmanipulationen das dACC-Signal in der Reverse-Inferenzkarte aus Angst auslösen, haben wir gezählt, wie viele Studien mit dACC-Aktivierungen Schmerzmanipulationen aufwiesen und wie viele Studien ohne dACC-Aktivierungen Schmerzmanipulationen aufwiesen. Wie in der Abbildung unten zu sehen ist, verwenden eine beträchtliche Mehrheit von Angststudien (71%), die eine dACC-Antwort erzeugen, Schmerzmanipulationen, wohingegen eine beträchtliche Mehrheit von Angststudien (69%), die keine dACC-Antwort produzieren, keinen Schmerz verwenden Manipulationen. Der Chi-Quadrat-Vergleich dieser 2 × 2 war hoch signifikant; X 2 > 8,013, p <0,006, d = 0,87. Dieses Ergebnis legt nahe, dass Angststudien, die eine Schmerzmanipulation beinhalten, eher eine dACC-Antwort hervorrufen.

Matthew Lieberman
Quelle: Matthew Lieberman

Betrachtet man die Möglichkeit, dass die dACC-Antwort auf Angst in Neurosynths Rückschluss-Karte (a) konzeptionell mit dACC-Reaktionen auf Schmerzen verbunden ist oder (b) buchstäblich auf Schmerzmanipulationen zurückzuführen ist, die die dACC in Angststudien aktivieren, dann ist es sinnvoll zu kombinieren die dACC Antworten auf Schmerz und Angst. Obwohl wir nicht zu viel von diesen Analysen machen wollen, wenn Schmerz und Angst zu einem einzigen kombinierten ROI (nachfolgend: Schmerz + Angst) kombiniert werden, finden wir, dass 566 der 1110 dACC-Voxel Selektivität für einen der 13 Terme zeigen . Somit sind 51% der dACC-Voxel unter diesen Bedingungen selektiv. Darüber hinaus sind 532 der 566 selektiven Voxel selektiv für Schmerz + Angst. Mit anderen Worten, 94% der selektiven dACC-Voxel in dieser Analyse sind selektiv für Schmerz + Angst. Darüber hinaus sind 48% aller dACC-Voxel selektiv für Schmerz + Angst.

Zusammengefasst, wenn wir Schmerz und Angst als Teil eines einzelnen Konstrukts behandeln, was die dACC betrifft, sehen wir, dass fast die Hälfte aller dACC-Voxel selektiv für dieses Konstrukt und fast alle dACC-Voxel sind, die für irgendetwas selektiv sind sind für dieses Konstrukt selektiv. Wie in unseren Hauptanalysen im vorherigen Abschnitt erwähnt, gibt es keinen anderen Begriff neben Belohnung (hier 5% der selektiven Voxel), der sogar nur 1% der selektiven Voxel im dACC erreicht.

Informieren uns z-Scores in Neurosynth über Rückschlüsse?

Wir denken, dass es eindeutig der Fall ist, dass z-Scores in Neurosynth etwas über Rückschluss sagen. Daher ist einer der unerwartetsten Aspekte des Austauschs über unser PNAS-Papier, dass TY und TW, die Schöpfer von Neurosynth, vorschlagen, dass fast nichts über umgekehrte Schlussfolgerungen aus den z-Scores gelernt werden kann und dass wir uns primär darauf konzentrieren sollten die hinteren Wahrscheinlichkeiten. Zum Beispiel schrieb TY:

"Ich erklärte, warum man keine Unterstützung für eine umgekehrte Inferenz mit Z-Scores oder p-Werten erhalten kann. Reverse-Inferenz ist inhärent eine Bayes'sche Vorstellung und macht nur dann Sinn, wenn Sie bereit sind, über frühere und spätere Wahrscheinlichkeiten zu sprechen. "

Wir finden das merkwürdig, denn wenn man das Neurosynth-Webinterface benutzt und einen Begriff betrachtet, gibt es einen einzigen Knopf auf dem Bildschirm, der als "umgekehrte Inferenz" bezeichnet wird. Wenn Sie auf diese Schaltfläche klicken, wird eine Heatmap angezeigt, die aufgrund ihres Beschriftungsschemas nur annehmen kann, dass sie uns etwas über eine umgekehrte Schlussfolgerung sagen soll. Diese Heatmap ist eine Heatmap der Rückwärts-Inferenz-Z-Scores, keine Posterior-Wahrscheinlichkeiten. Wenn Sie die umgekehrte Inferenzkarte für einen beliebigen Ausdruck herunterladen, ist es in ähnlicher Weise eine Karte der z-Werte, nicht der späteren Wahrscheinlichkeiten. Obwohl sie nicht Bayesisch sind, sind diese Z-Scores genau das, was TY und TW verwendet haben, um ihre "Rückschluss" -Karten zu füllen. Wenn diese uns nicht über umgekehrte Inferenz erzählen, dann ist es sehr seltsam, dass die einzige umgekehrte Inferenz-Schaltfläche in der Schnittstelle zu diesen z-Scores führt.

TY hat auch über den Wert der z-Scores von Neurosynth an mehreren Stellen geschrieben, die der obigen Behauptung zu widersprechen scheinen ("man kann keine Unterstützung bekommen …"). Zuerst haben wir den Text aus der Neurosynth FAQ:

Reverse-Inferenz-Karte: z-Scores, die der Wahrscheinlichkeit entsprechen, dass ein Begriff in einer Studie verwendet wird, in Anbetracht des Vorhandenseins der berichteten Aktivierung (dh P (Term | Activation))

Das klingt für uns wie der Z-Score sagt uns etwas über umgekehrte Schlussfolgerung. Hier sind Auszüge aus dem, was TY auf Google+ geschrieben hat, wo er gnädig viele Fragen von Benutzern zu Neurosynth beantwortet:

"Der Z-Score ist ein Maß für das Vertrauen in die statistische Assoziation; Die posteriore Wahrscheinlichkeit ist ein Maß für die Effektgröße. Im Allgemeinen empfehle ich, der ersteren mehr Aufmerksamkeit zu widmen , da letztere dem Rauschen in Stichprobengröße unterliegt. Ein Begriff mit weniger Studien, die in der Meta-Analyse enthalten sind, wird eine höhere Variabilität aufweisen, was zu extremeren Posterior-Wahrscheinlichkeiten führt. Allerdings wird ein Begriff mit weniger Studien auch * weniger * extreme p / z-Werte produzieren, wenn andere Dinge gleich sind. Wenn Sie also versuchen, das Formular zu beanspruchen, "ist es wahrscheinlich, dass Funktion F mit Aktivität in Region R verknüpft ist", dann ist es wahrscheinlich besser, wenn Sie diese auf dem Z-Score aufbauen . [Betonung hinzugefügt]"

Diese Aussage ist völlig unvereinbar mit seiner Behauptung, dass "eine Kanone Unterstützung für eine umgekehrte Inferenz mit Hilfe von z-Scores erhalten hat". In seinem Blog schrieb er auch dieses von z-Scores:

"Alles, was es uns sagt, ist, dass es angesichts aller Daten, die wir haben, sehr unwahrscheinlich ist, dass es zwischen einem Begriff und einer Region genau keine Verbindung gibt."

Trotz der abwertenden Phrasierung denken wir, dass "das alles uns sagt" ziemlich erstaunlich ist, da wir vor Datenbanken wie Neurosynth keine Möglichkeit hatten, dies zu tun. Dies ist eine wirklich wichtige Sache zu wissen, besonders wenn sie mit anderen Analysen kombiniert wird, was darauf hindeutet, dass es für andere Begriffe keine Beweise für eine Assoziation zwischen dem Begriff und der Region gibt. Schließlich schreibt TY:

"Wenn es das Ziel ist, einfach so etwas wie" wir denken, dass die temporoparietale Verbindung mit biologischer Bewegung und Theorie des Geistes verbunden ist "oder" Beweise weisen darauf hin, dass der parahippocampale Kortex mit der räumlichen Navigation verbunden ist ", sehe ich nichts falsch mit diesem Anspruch auf Neurosynth-Z-Score-Karten. "

Wir denken, dass dies genau der Anspruch ist, den wir machen, und zeigen, dass wir am ehesten berechtigt sind, schmerzbezogene Behauptungen über die dACC-Funktion zu machen, als Ansprüche für andere Begriffe. Im PNAS-Papier haben wir dies getan, indem wir Begriffe mit nicht signifikanten Z-Werten (Exekutive, Konflikt, Salienz) mit einem Begriff verglichen haben, der (Schmerz) hat. Während diese nicht zeigen, dass die Effektstärken für Schmerz größer sind als die anderen Begriffe (was nie unser Ziel war), zeigen sie, dass wir sicherer sein können, dass es einen echten Zusammenhang zwischen Schmerz und dACC gibt als zwischen den anderen dreien Begriffe und dACC. Wir denken, dass dies ein wertvoller Beitrag ist. In den aktuellen Analysen haben wir einen anderen Ansatz gewählt und die Anzahl der Voxel gezählt, die für einen und nur einen von 14 Termen eine umgekehrte Inferenz aufweisen. Wiederum waren die meisten Voxel in der dACC, die diese Kriterien erfüllen, selektiv für Schmerz.

TW gibt in seiner Blog-Antwort einige nette Details darüber, wie der Z-Score berechnet wird, und beginnt eigentlich als Chi-Quadrat:

"Es vergleicht die Häufigkeit der Aktivierung für einen Zielterm (" Schmerz ") mit der Basisaktivierungsrate für die anderen Studien (" kein Schmerz "). Formal vergleicht es P (A | Schmerz) mit P (A | nicht Schmerz) unter Verwendung eines Chi-Quadrat-Tests. So sagt es uns über Präferenz, aber nicht Spezifität im Vergleich zu anderen potentiellen Zuständen. "

Wir sind uns einig, dass der Z-Score für Schmerzen die Aufgabe nicht alleine erfüllt. Wenn wir aber auch P (A | Motor) und P (A | nicht Motor) für die gleichen Koordinaten kennen, können wir beurteilen, ob diese Aktivierung für den Schmerz selektiver ist als der Motor. Je größer der Z-Wert ist, desto mehr Vertrauen haben wir, dass P (A | term) größer ist als P (A | not term). Der Vergleich dieser z-Scores über Terme (z Schmerz gegen z- Motor ) sagt uns etwas darüber aus, ob wir mehr Vertrauen haben sollten, dass einer dieser Begriffe mit der Aktivität in der Region von Interesse verbunden ist, als der andere Ausdruck.

Schließlich haben wir nun die posterioren Wahrscheinlichkeiten für die Begriffe Schmerz, Exekutive, Konflikt und Salienz unter Verwendung der 8 Voxel, auf die wir uns in unserem PNAS-Papier konzentrierten, verglichen. Zum Beispiel verglichen wir die Posterior-Wahrscheinlichkeiten für Schmerz (unter Verwendung der 8 Posterior-Wahrscheinlichkeiten für Schmerz, die von 8 verschiedenen Aktivierungspunkten kamen) mit den Posterior-Wahrscheinlichkeiten für Exekutive (unter Verwendung der 8 Posterior-Wahrscheinlichkeiten für Exekutive) unter Verwendung eines t-Tests mit wiederholten Messungen. Für Schmerz gegenüber jedem der anderen drei Begriffe waren die Schmerz-posterior-Wahrscheinlichkeiten signifikant höher, t> 5,92, p <0,003, d > 4,47. Darüber hinaus sind die posterioren Wahrscheinlichkeiten für Schmerzen, selbst wenn sie Schmerz mit Angst und autonom vergleichen, signifikant höher, t> 2,92, p = 0,03, d > 2,21. Wir haben nie gedacht, dass der Vergleich von Posterior-Wahrscheinlichkeiten wesentlich für das Erreichen unseres Arguments ist, aber dies ist zumindest ein Beweis dafür, dass der Effekt da ist.

Vielleicht sollte es nicht überraschen, dass wir das gleiche mit späteren Wahrscheinlichkeiten sehen, die wir mit den z-Scores gesehen haben, da zumindest bei den Daten, die wir uns angesehen haben, die beiden Statistiken sehr ähnlich waren. Genauer gesagt, die Korrelation aller Posterior-Wahrscheinlichkeiten und Z-Scores für die Terms of Interest in den 8 Standorten in unserem PNAS-Papier untersucht wurde r = 0,86 . Obwohl zwischen diesen Maßen ein konzeptuelles Tageslicht liegen könnte, lieferten sie in unseren Analysen funktional ungefähr die gleiche Information. Diese Ähnlichkeit ist in der folgenden Abbildung zu sehen, in der Z-Scores gegen Posterior-Wahrscheinlichkeiten für Schmerz, Exekutive, Konflikt und Salienz von den 8 Stellen in unserem PNAS-Papier aufgetragen sind. Man kann auch sehen, dass die 7 höchsten Posterior-Wahrscheinlichkeiten und die 7 höchsten Z-Scores alle aus Schmerz kommen. Beachten Sie, dass die krummlinige Beziehung wahrscheinlich darauf zurückzuführen ist, dass die posterioren Wahrscheinlichkeiten auf eine obere Grenze von 1,0 beschränkt sind.

Matthew Lieberman
Quelle: Matthew Lieberman

Selektivität

Wir haben bereits einiges über Selektivität in unserem vorherigen Blog gesagt. Wir wollen nur noch ein paar Dinge sagen. Zum einen gibt es keine allgemeingültige Definition von Selektivität (TW beschreibt sie als "vage definiert"). Menschen haben Definitionen, aber nicht jeder hat die gleiche. Die Implikation ist, dass jeder von uns sagen muss, was wir unter Selektivität verstehen, wenn wir den Begriff verwenden (etwas, das fast keine Papiere, die diesen Begriff verwenden, verwenden, einschließlich unseres PNAS-Papiers). Wir werden in Zukunft sicherlich vorsichtiger darüber sein, aber wir sollten die Definitionen der verschiedenen Forscher respektieren, wenn sie sie geben, und sie nicht als eine schlechte oder inkohärente Definition behandeln, nur weil sie anders ist als unsere eigenen. Wir haben nun mindestens drei Definitionen der Selektivität in dACC-Voxeln gesehen, die alle vernünftig sind:

Selektivität L & E : dACC-Voxel sind selektiv für Schmerzen, wenn der Schmerz eine zuverlässigere Quelle der dACC-Aktivierung ist als die anderen Begriffe von Interesse (Exekutive, Konflikt, Salienz).

Selektivität TY : dACC-Voxel können als "selektiv" für eine bestimmte Funktion bezeichnet werden, wenn sie (i) eine robuste Assoziation mit dieser Funktion zeigt, (ii) eine vernachlässigbare Assoziation mit allen anderen leicht verfügbaren Alternativen zeigt und (iii) die Autoren haben sorgfältig geprüft, ob die in der Literatur vorgeschlagenen wichtigen Kandidatenfunktionen in ihrer Analyse gut vertreten sind.

Selektivität TW : dACC-Voxel sind selektiv für eine bestimmte Funktion, wenn das Voxel von dieser Funktion aktiviert wird und "nicht von anderen Dingen aktiviert wird"

Wir denken, dass die Definition von TW vertretbar ist, aber es schließt wahrscheinlich nichts selektives aus fMRI-Analysen aus, da es im Gehirn wahrscheinlich wenige bis gar keine Voxel gibt, die Aktivierung zu einem einzigen Prozess zeigen (dh nur in einer einzigen Vorwärtsinferenzkarte erscheinen). Wir denken, dass unsere Definition und die Definition von TY praktischer sind. Wir glauben, dass dies in den meisten MVPA-Studien implizit ist, die Selektivität bis heute diskutieren, und wir denken, dass TYs einen höheren Balken darstellen, aber einen interessanten Balken, der Werkzeuge wie Neurosynth anstelle von MVPA erfordert.

Empirische Prioren

In TYs letztem Blog schlägt er vor, dass eines unserer Probleme darin besteht, dass die Verwendung von Posterior-Wahrscheinlichkeiten irreführend ist. Die posterioren Wahrscheinlichkeiten für Schmerz liegen um .80, während die hinteren Wahrscheinlichkeiten für andere in der Studie untersuchte Begriffe zwischen 0,50 und 0,60 liegen (wobei 0,50 im Wesentlichen ein Null-Effekt ist). Wir denken, dass diese Unterschiede (und insbesondere die damit verbundenen z-Score-Unterschiede) etwas über die wahrscheinlichen Funktionen von dACC sagen. TY impliziert jedoch, dass wir davon ausgehen, dass basierend auf diesen Effekten, wenn eine neue Neurosynth-Studie mit dACC-Aktivität zufällig ausgewählt wird, wir eine Schmerzstudie voraussagen könnten. Obwohl wir sehen können, warum TY denken könnte, dass wir das glauben würden, haben wir diese Behauptung nie gemacht und glauben dies tatsächlich nicht.

TY weist darauf hin, dass die .80 posteriore Wahrscheinlichkeit für Schmerzen davon abhängt, mit dem .50-Wert zu beginnen, den Neurosynth für jeden Ausdruck voraussetzt. In keiner Weise bedeutet eine .80-posteriore Wahrscheinlichkeit in Neurosynth, dass 80% der Studien mit dACC-Aktivierungen Schmerzstudien waren. Tatsächlich haben wir bereits in unserem PNAS-Papier darauf hingewiesen:

"Eine a posteriori Wahrscheinlichkeit entspricht einer Effektgröße, obwohl sie nicht direkt interpretierbar ist, weil der Bayes'sche Prior für jeden Term auf 0,50 normiert wurde. Somit ist eine a posteriori Wahrscheinlichkeit von 0,82 wahrscheinlich eine signifikant größere Effektgröße als eine andere von 0,56; Aufgrund der Normierung kann man jedoch nicht sagen, dass 0,82 impliziert, dass es eine 82% ige Chance gibt, dass eine Aktivierung aus einer Studie mit einem bestimmten psychologischen Begriff stammt. "

TY geht dann weiter, um die empirischen Prioren für Schmerz und andere Begriffe zu diskutieren. Da der Schmerz in der Zusammenfassung von 3,5% aller Studien in der Neurosynth-Datenbank erscheint und der Motor in der Zusammenfassung von 18% aller Studien in der Neurosynth-Datenbank erscheint, wenn diese (.03 und .18) als empirische Priors für verwendet werden jeder Ausdruck (anstelle von .50), Motor endet mit höheren späteren Wahrscheinlichkeiten als Schmerz.

Wir stimmen vollkommen zu, dass wenn Sie eine Studie in der Neurosynth-Datenbank mit einer dACC-Aktivierung sehen, diese eher aus einer motorischen Studie als aus einer Schmerzstudie stammt. Dennoch denken wir, dass dies fast völlig nebensächlich ist. Wir sind nicht an der Verteilung von Studien in der Neurosynth-Datenbank per se interessiert. Wir sind daran interessiert, Rückschlüsse auf die wahrscheinliche (n) Funktion (en) der dACC in der realen Welt zu ziehen. Dass es mehr motorische Studien als Schmerzstudien in der Neurosynth-Datenbank gibt, spricht nur für frühere Forschungsprioritäten der Wissenschaftler und vielleicht für die größere Leichtigkeit, mit der eine motorische Studie durchgeführt werden kann, verglichen mit der Schwierigkeit, eine Schmerzstudie durchzuführen.

Um zu verdeutlichen, wie irrelevant dieser Unterschied im Neurosynth-basierten Prior ist, beachte das folgende Beispiel. Stellen Sie sich eine Datenbank mit nur Schmerz- und Bewegungsstudien vor. Angenommen, es gibt 100 Schmerzstudien und 1.000.000 motorische Studien in der Datenbank. Stellen Sie sich außerdem vor, dass 100% der Schmerzstudien dACC-Aktivität in einem bestimmten Voxel produzieren und dass nur 1% der motorischen Studien dACC-Aktivität in demselben Voxel produzieren. Wenn wir zufällig eine Studie aus dieser Datenbank ziehen würden, die Aktivität in diesem dACC-Voxel zeigt, wäre es 100 Mal wahrscheinlicher, eine motorische Studie zu sein als eine Schmerzstudie. Dennoch würde jede vernünftige Person diese Ergebnisse betrachten und schlussfolgern, dass dieser Punkt in der dACC wahrscheinlich in Schmerzen involviert ist, aber nicht in motorische Prozesse involviert ist. Das Chi-Quadrat würde diese Schlussfolgerung unterstützen.

Wir verstehen, dass 3,5% und 18% in gewisser Hinsicht empirische Priors für Schmerz und Motor im Kontext von Neurosynth sind, aber sie sind keine realen empirischen Priors (und TY weist darauf später in seinem Blog hin). Wir denken, dass TYs Entscheidung, alle Prioren auf 0,50 zu setzen, als er Neurosynth entwickelte, eine wirklich gute Idee war, weil es verhindert, dass Effekte durch die Arten von Studien gesteuert werden, die in der Datenbank besser vertreten sind.

In TYs erstem Blog gab er eine großartige Erklärung, wie man tatsächlich über Posterior-Wahrscheinlichkeiten denkt. Er schrieb:

"Die strikte Interpretation einer posterioren Wahrscheinlichkeit von 80% für Schmerzen in einem dACC-Voxel ist, dass, wenn wir 11.000 veröffentlichte fMRI-Studien machen und behaupten, dass genau 50% von ihnen den Begriff 'Schmerz' in ihren Abstracts enthalten, das Vorhandensein von Aktivierung in dem fraglichen Voxel sollte unsere Schätzung der Wahrscheinlichkeit, dass der Begriff "Schmerz" auftritt, von 50% auf 80% erhöhen. "

Lassen Sie uns dieses Beispiel also ein bisschen spielen. Angenommen, wir haben 2.000 Studien in einer hypothetischen Neurosynth-Datenbank statt 11.000. Indem wir den Prior für Schmerz auf 0,50 setzen, sagen wir: "Stellen Sie sich vor, dass 1000 der 2000 Studien den Begriff Schmerz im abstrakten und den anderen 1000 nicht haben". Stellen Sie sich vor, dass über diese 2.000 Studien 1.000 von ihnen dACC-Aktivität in einem Voxel von Interesse haben (z. B. Koordinaten 0, 18, 30). Eine posteriore Wahrscheinlichkeit für einen Schmerz von 0,81 bei diesem Voxel würde implizieren, dass etwa 810 von den 1000 Studien mit dACC in dieser Probe (oder einer neuen Gruppe von Studien mit der gleichen Schmerz / Nicht-Schmerz-Verteilung) mit Schmerzen als erwartet wären ein Ausdruck und ungefähr 190 von den 1000 Studien mit dACC in dieser Probe, um nicht Schmerz als Ausdruck zu haben. Im Gegensatz dazu, wenn der Motor eine posteriore Wahrscheinlichkeit von 0,51 für dieses Voxel hat, sollten wir erwarten, dass etwa 510 von den 1000 Studien mit dACC in dieser Probe einen Motor als Ausdruck und etwa 490 von den 1000 Studien mit dACC in diesem haben Probe, um keinen Motor als Ausdruck zu haben. Obwohl Schmerz und Motor in diesen Analysen nicht direkt verglichen wurden, glauben wir, dass diese beiden Analysen darauf hindeuten, dass Schmerzen die Aktivität dieses Voxels besser beschreiben als motorische Prozesse. Dies spiegelt sich auch in den Z-Scores bei 0, 18, 30 für Schmerz (Z = 9,90) und Motor (Z = 0,21) wider.

TY schreibt auch folgendes:

"Das Interessante an all dem ist, dass sich der Neurosynth-Z-Score nie ändert, egal, welchen Prior man für einen bestimmten Begriff wählt. Das liegt daran, dass der Z-Score ein häufiges Maß für die statistische Assoziation zwischen Termauftreten und Voxelaktivierung ist. Alles, was wir sagen, ist, dass es angesichts aller Daten, die wir haben, sehr unwahrscheinlich ist, dass es zwischen einem Begriff und einer Region genau null Assoziationen gibt. Dies mag interessant sein oder nicht (ich würde behaupten, dass es das nicht ist, aber das ist für einen anderen Beitrag), aber es ist sicherlich keine Rückschlussfolgerung wie "dACC-Aktivierung deutet darauf hin, dass Schmerzen vorhanden sind". Um den letzteren Anspruch zu ziehen, müssen Sie einen Bayes'schen Rahmen verwenden und einige vernünftige Priors auswählen. Keine Prioren, keine Rückschlüsse. "

Das macht für uns noch wenig Sinn. Erstens, soweit wir das beurteilen können, haben wir nie die Worte geschrieben, die TY uns hier zuzuschreiben scheint ("dACC-Aktivierung deutet darauf hin, dass Schmerz vorhanden ist"), und zwar deshalb, weil wir diese Ansicht nicht unterstützen. Darüber hinaus verstehen wir, dass Sie ohne ein Bayes-Gerüst keine Posterior-Wahrscheinlichkeiten erhalten, was eine Schätzung der Stärke des umgekehrten Inferenz-Effekts liefert. Der Z-Score scheint uns jedoch zu sagen, ob es einen Rückschluss-Effekt von ungleich Null gibt. Daher sagt uns der Z-Score etwas Interessantes über die umgekehrte Schlussfolgerung. Wenn es 14 Accounts des dACC gibt und nur einer der 14 Accounts einen signifikanten Z-Score in ihren Rückwärtsinferenzkarten für ein bestimmtes Voxel hat, dann haben wir definitiv etwas über die Funktion dieses Voxels gelernt, ohne auf die späteren Wahrscheinlichkeiten Bezug zu nehmen.

Können wir jemals sagen, dass eine Region des Gehirns eine Funktion hat?

TW stellte die Prämisse unseres Papiers insgesamt in Frage und schlug vor:

"Wir sollten nicht nach einer einheitlichen Erklärung für dACC-Aktivitäten suchen, es sei denn, sie beschreiben eine Sammlung verschiedener Prozesse. Der Versuch, die "beste Interpretation" für eine Sammlung von 550 Millionen Neuronen zu finden, ist irreführend, weil sie uns dazu verleitet, psychologische Schlussfolgerungen auf der Grundlage von Gehirnaktivitäten zu machen, die nicht gerechtfertigt sind. In Analogie dazu ist es, als würde man versuchen zu erraten, ob eine Person ein Republikaner oder ein Demokrat ist, basierend auf ihrem Heimatstaat. Die "beste Interpretation" der Wähler, die in Texas leben, ist, dass sie Republikaner sind. Sie hätten Recht, Republikaner zu erraten, aber Sie hätten nur 57 Prozent der Zeit recht. "

Dies ist wirklich eine Frage der Philosophie der Wissenschaft in Bezug auf Einheiten / Ebenen der Analyse. Das gleiche Problem taucht in der Sozialpsychologie auf, wenn wir sagen: "Unter bestimmten Bedingungen neigen die Menschen dazu, Konformitätseffekte zu zeigen." Dies impliziert nicht, dass jede Person diese Effekte zeigt, sondern dass es eine zentrale Tendenz gibt kann statistisch vom Rauschen unterschieden werden. Nur weil es einige Leute gibt, die sich nicht anpassen, heißt das nicht, dass wir nicht auf nützliche Weise darüber reden können, was Menschen im Allgemeinen tun.

TWs Position ist philosophisch vertretbar, führt jedoch weitgehend zu der Schlussfolgerung, dass fMRT praktisch keine psychologische Funktion innerhalb einer Gehirnregion identifizieren kann, da jedes einzelne Voxel etwa 5,5 Millionen Neuronen enthält (Logothetis, 2008) und es wahrscheinlich keine Region gibt 100% dieser Neuronen werden von einer einzigen Funktion / einem einzigen Prozess und keiner anderen Funktion / einem anderen Prozess aufgerufen. Aber Wissenschaftler haben eindeutig Nutzen darin gefunden, den Hippocampus in Bezug auf eine bestimmte Funktion zu beschreiben, obwohl er Millionen von Neuronen hat, die nicht alle dasselbe tun. Wir schlagen nicht vor, dass eine bestimmte Funktion die endgültige Beschreibung der Hippocampusfunktion ist, aber wir vermuten, dass es kein sinnloses Unterfangen ist, eine allgemeine Funktion für den Hippocampus zu postulieren, die im Laufe der Zeit diskutiert, verfeinert und aktualisiert wird.

Wenden wir uns dem Beispiel von TW zu, bei dem ein zufällig ausgewählter Texaner ein Republikaner ist, basierend auf der Tatsache, dass 57% der Texaner 2012 für Romney stimmten (gegenüber 41% für Obama). Wir denken, dass dies ein großartiges Beispiel ist, aber es erfasst nicht die Frage, an der wir eigentlich interessiert sind. Wenn wir einzelne Texaner mit dACC Neuronen und dem Staat Texas mit dem dACC als Ganzes gleichsetzen, dann ist unsere wahre Frage nicht ob wir raten können, ob eine bestimmte Person Republikaner ist (obwohl Sie verrückt wären, Republikaner nicht zu schätzen, wenn Sie gezwungen wurden, zu wetten). Stattdessen ist unsere Frage eher "Funktioniert Texas als republikanischer Staat, trotz der Tatsache, dass viele Individuen in diesem Staat keine Republikaner sind?" Die Antwort auf diese Frage ist ein klares Ja. Diese 57%, die Republikaner wählen, haben die Dominanz der Republikaner in jedem Regierungsbereich sichergestellt: im US-Senat (100%); US-Repräsentantenhaus (69%); Texas State Senatoren (68%); Texas Vertreter (65%); und Texas Supreme Court Gerechtigkeit (100%). Diese Zahlen sind leicht genug, um sicherzustellen, dass Texas als republikanischer Staat funktioniert. Mit 65% oder mehr in beiden Häusern der Legislative des Staates, können die Republikaner durch 100% republikanische freundliche Gesetzgebung abstimmen und das State Supreme Court kann republikanische freundliche Entscheidungen treffen, immer wieder. Vielleicht von größter Bedeutung ist, dass diese 57% der Texaner, die Republikaner wählen, 100% von Texas 38 Wahlstimmen an den republikanischen Kandidaten für Präsident die letzten 9 Wahlen in Folge geschickt haben. Wir halten es derzeit für sinnvoll, Texas als einen republikanischen Staat zu bezeichnen, da dies einen großen praktischen Wert hat. Jeder Bürger braucht kein Republikaner zu sein, um dies zu gewährleisten, und die Tatsache, dass es städtische Enklaven gibt, die die Demokratische Partei lehnen, unterminiert diese Beschreibung des Staates. (Für diejenigen, die eher rechnerisch versiert sind, betrachten Sie einfach ein verbindungsorientiertes Netzwerk. Wenn eine Repräsentation in den Gewichtungen, die einige Knoten verbinden, einen kleinen Vorteil hat, werden iterative Constraint-Zufriedenheitsprozesse diesen kleinen Vorteil in einen großen funktionalen Vorteil in den Ergebnissen verwandeln.)

Fazit

Beziehen die Z-Scores aus den Reverse-Inferenz-Karten die Stärke der umgekehrten Inferenz-Effekte? Nein, aber sie korrelieren in unseren Analysen mit den späteren Wahrscheinlichkeiten .86. Sagen die Z-Scores aus den Reverse-Inferenz-Karten, wo im Gehirn verlässliche Beweise für eine umgekehrte Inferenz-Assoziation existieren? Absolut. Können die Z-Scores also als Werkzeug für die umgekehrte Inferenz verwendet werden, wenn wir Voxel identifizieren, die signifikante Z-Scores für einen Term zeigen, aber nicht für andere von Interesse? Absolut.

Denken wir, dass jedes Neuron oder Voxel im dACC selektiv für Schmerz ist oder sogar aktiviert wird? Nein. Denken wir, dass es keine Diskussion über die Funktion des dACC geben kann? Nein. Sind die meisten Voxel in der dACC selektiv mit der Definition von TY? Nein, aber etwa 43% der dACC-Voxel zeigen Selektivität unter Verwendung der 14 von uns betrachteten Terme (was bedeutet, dass diese Voxel in einer und nur einer der 14 betrachteten Reverse-Inferenzkarten auftraten).

Von diesen dACC-Voxeln, die selektiv sind, sind 91% selektiv für Schmerzen . Ist der dACC selektiv für Schmerzen im Vergleich zu Exekutiv-, Konflikt- und Salienzprozessen, wie wir im PNAS-Papier argumentiert haben? Absolut – nur 1 Voxel der 477 Voxel, die Selektivität zeigen, ist selektiv für jeden dieser drei Prozesse. Basierend auf Neurosynth-Beweisen, ist dACC mehr selektiv für Schmerz als für Aufmerksamkeit, Autonomie, Vermeidung, Konflikt, Emotion, Fehler, Exekutive, Angst, negativer Affekt, Response-Inhibition, Response-Auswahl, Belohnung und Salienz? Absolut. Angesichts der Tatsache, dass nur wenige, einschließlich uns, davon ausgehen würden, dass der dACC so viel schmerzempfindlicher ist als all diese anderen Berichte, glauben wir, dass unsere Ergebnisse einen wesentlichen Beitrag zur affektiven und kognitiven Neurowissenschaft leisten.