Teilen und erobern

J. Krueger
Das goldene Verhältnis
Quelle: J. Krüger

Ich habe diesen Aufsatz mit Patrick Heck geschrieben.

Im Prinzip Verhältnis . ~ St. John, pseudepigraphisch

In diesem Aufsatz geht es um ein scheinbar einfaches mathematisches Thema, von dem wir glauben, dass es weitreichende psychologische Implikationen hat. Bevor wir uns der Sache zuwenden, wollen wir den hl. Johannes kommentieren, der sein Evangelium durch die Gleichsetzung des Logos mit Gott öffnet. Logos ist ein altgriechisches Konzept von enormer Schwerkraft. Es kann sich auf Wörter, Phrasen, Bedeutung oder Kommunikation beziehen, aber auch auf die göttliche Ordnung der Natur und des Naturgesetzes. Man könnte sogar Ähnlichkeiten zwischen dem Altgriechischen Logos und dem Tao des Ostens sehen. Im modernen Westen reduziert sich der Logos auf das Wort, eine Degradierung, die mit dem Vulgata-Testament begann, das den Logos als Verbum darstellt. Stell dir vor, Gott ist ein Verb. Außerhalb der Bibel stellten die Lateiner den Logos als Ratio dar, und da sind wir mitten in der Sache. Aus dem Verhältnis werden Rationalität und Rationalität, der Goldstandard des Denkens, die höchste Reichweite des psychologischen Funktionierens.

Eine andere Bedeutung des Verhältnisses bezieht sich auf das Ergebnis der Division, was man durch die Fraktionierung erhält. Aber wie verschieden ist diese enge mathematische Bedeutung von der kognitionspsychologischen? In Anlehnung an Posner (1973), der das Denken als Vorstellung von dem, was nicht unmittelbar gegeben ist (den Stimulus) definiert und seine Beziehungen berücksichtigt, diagnostizierte Dawes (1988) relatives, vergleichendes und fraktionierendes Denken als das Herz der Rationalität. Dawes hat dabei die Herstellung von Verhältnissen in das Erreichen von Rationalität eingebettet. In der Urteils- und Entscheidungspsychologie kommen Verhältnisse und ihre vermutete Rationalität meist als Teil eines größeren Bayes'schen Arguments. Reverend Bayes lehrte, wie man einen wohlerzogenen Geist hat, einen Geist, der sich nicht widerspricht.

Ich erinnere mich, wie es vorgestern war, als ein Klassenkamerad in der Graduate School einen Artikel von McCauley und Stitt (1978) zusammenfasste, der zeigen sollte, dass soziale Stereotypen Bayes sind, das heißt, dass sie relativ sind. Betrachten Sie die Japaner. Sie haben – Gott sei Dank – eine niedrige Suizidrate, aber diese Rate kann – und kann wahrgenommen werden – ein bisschen größer sein als im Rest der Welt oder in Ihrem eigenen Land, wenn es nicht Japan ist. Nehmen wir an, die wahrgenommene Suizidrate in Japan beträgt 3%, in Luxemburg dagegen 1%. Laut McCauley & Stitt macht dieses Wahrnehmungsdifferential das Sterben stereotypisch für die Japaner und das Gegen-Stereotyp der Luxemburger, und es sollte als Diagnoseverhältnis ausgedrückt werden ; hier 3/1. McCauley & Stitt argumentierten, dass die diagnostische Kennzahl ein besseres und zutreffenderes Maß an Stereotypisierung ist als der gute altmodische Prozentwert, der für die Japaner erhalten wurde. Tatsächlich fanden sie heraus, dass diagnostische Verhältnisse mit typischen Bewertungen korreliert sind ("Wie typisch ist Selbstmord der Japaner?"), Aber in einer mehrjährigen Suche zeigten meine Kollegen und ich, dass der Zähler (% Japanisch) alles macht die Arbeit, während der Nenner (% Luxemburger) die Maßnahme degradiert, anstatt sie zu schärfen (reviewed in Krueger, 2008). Einfache prozentuale Schätzungen für eine Gruppe korrelieren stärker mit Traitentypizität-Bewertungen als diagnostische Verhältnisse. Wir können dies sogar in McCauley & Stitts eigenen Daten sehen.

Warum hielten McCauley & Stitt diagnostische Verhältnisse für überlegen? Sie gingen von der Prämisse aus – einem früheren Glauben, den Sie vielleicht sagen würden – dass alle Erkenntnis und damit soziale Erkenntnis Bayesianisch ist. Dies bedeutet, dass Überzeugungen probabilistisch ausgedrückt werden können und dass eine Reihe von Überzeugungen in Bayes 'Art konsistent ist – oder zumindest sein sollte. Im Satz von Bayes ist das Verhältnis der Wahrscheinlichkeit, dass ein japanischer Mensch durch Selbstmord stirbt, p (S | J) geteilt durch die Wahrscheinlichkeit, dass ein Luxemburger durch Selbstmord stirbt, p (S | L), gleich dem Verhältnis der hinteren Klassifikation, dh die Wahrscheinlichkeit, dass ein Suizid Japanisch ist, p (J | S), über die Wahrscheinlichkeit, dass ein Suizid luxemburgisch ist, p (L | S), wenn er mit dem Verhältnis der vorherigen Wahrscheinlichkeit, dass eine Person ist, multipliziert wird Japanisch, p (J), über die vorherige Wahrscheinlichkeit, dass eine Person luxemburgisch ist, p (L). Mit anderen Worten, der Satz von Bayes verlangt die Berechnung eines Verhältnisses von bedingten Wahrscheinlichkeiten, so dass eine Person aufgrund ihrer unterschiedlichen Suizidwahrscheinlichkeiten als japanisch oder luxemburgisch klassifiziert werden kann. Elegant wie Bayes Methode ist es nicht eine gute Beschreibung, wie Menschen die Typizität verschiedener Merkmale in sozialen Gruppen wahrnehmen.

McCauley und andere bewegten sich später von den Verhältnissen zu den Unterschiedswerten ohne viel Kommentar. In beiden Fällen dachten sie wahrscheinlich, dass die Messung und Vorhersage nur verbessert werden kann, wenn man berücksichtigt, wie eine Vergleichsgruppe wahrgenommen wird. Die Verhältnis- und Differenzwerte unterscheiden sich jedoch in wichtigen Punkten. Erstens werden die Verhältnisse am Boden durch 0 begrenzt, aber sie haben keine Decke. Während 1,0 der Mittelpunkt ist, kann das Verringern des Zählers das Verhältnis nicht negativ machen, während das Verringern des Nenners das Verhältnis gegen Unendlich verschieben kann. Diese Asymmetrie führt zu stark schiefen Verteilungen. Im Gegensatz dazu kommen Differenzen mit einer bescheidenen und symmetrischen Verteilung um 0 in Frage, wobei das Maximum X max – Y max ist . Zweitens – und damit zusammenhängend – lässt sich anhand der Größe des Verhältnisses die Größe des Nenners abschätzen. Wenn das Verhältnis sehr groß ist, ist der Nenner wahrscheinlich sehr klein. Ein sehr großer Differenzwert sagt uns jedoch, dass sowohl Zähler als auch Nenner in der Nähe der Endpunkte ihrer Skalen sind, aber an entgegengesetzten Enden. Auf der intuitiv-konzeptuellen Ebene scheinen die Verhältnisse die Variable im Zähler zu "relativieren", während Differenz-Scores diese zu "korrigieren" scheinen.

Die Faszination für "relative" oder "korrigierte" Bewertungen ist zumindest aus zwei Gründen sehr ausgeprägt. Ein Grund ist, dass der Satz von Bayes einen Standard für das rationale Denken bietet. Rationales Denken ist kohärent und der Satz von Bayes garantiert, dass die Teile zusammenpassen. Wenn eine Wahrscheinlichkeit vernachlässigt oder überhaupt ignoriert wird, kann eine kohärente Anpassung nicht mehr garantiert werden und alle psychische Hölle kann sich lösen (Thomas Bayes war ein Geistlicher). Der andere Grund ist die alltägliche Intuition. Diese Intuition ist eine lustige Sache. Es sagt zum Beispiel, dass "mehr Information immer besser ist", aber dann tendiert sie dazu, ihren eigenen Rat zu ignorieren, wenn sie intuitive Urteile gefällt. Bayesianer und andere Korrektoren und Relativierer greifen auf die mehr als bessere Intuition zurück, wenn sie sich verabscheuen, wenn sie denken, dass einfache heuristische Hinweise als Entscheidungshilfen gut funktionieren. Auf ihrer Philosophie muss rationale Beurteilung teilen (oder subtrahieren), weil andernfalls Informationen auf dem Tisch liegen würden – und das würde früher oder später zu Chaos führen.

Relative Bewertungen wie Ratios oder Differenzen sind nützlich, wenn sie besser als eine ihrer einfachen Komponenten eine dritte Variable vorhersagen. Ein Grund dafür, warum sie das vielleicht nicht tun, ist, dass sie mit ihren Komponenten verwechselt werden. Differenzwerte sind leichter zu verstehen als Kennzahlen. Lasst uns also anfangen. Lehrbücher der Statistik lehren uns, dass Differenzen positiv mit der Variablen, von der wir subtrahieren, korrelieren und dass sie negativ mit der subtrahierten Variablen korreliert sind (McNemar, 1969). Die Korrelation, r , ist positiv zwischen X und X – Y, und sie ist negativ zwischen Y und X – Y.

J. Krueger
Quelle: J. Krüger

Wenn man die Varianzen beiseite legt oder annimmt, dass sie für X und Y gleich sind, können wir sehen, dass der Zähler wahrscheinlich positiv ist und dass er positiver wird, wenn die Korrelation zwischen X und Y abfällt oder negativ wird.

P. Heck
Verhältnisse aufgetragen gegen ihren Zähler
Quelle: P. Heck

Was kann jedoch über Verhältnisse gesagt werden? Wird das Verhältnis X / Y positiv mit seinem Zähler X korreliert? Wie kann es nicht so sein? Wenn X größer wird, muss ceteris paribus auch X / Y erhöhen. Nun, es scheint zunächst nicht so zu sein. Wir haben Computersimulationen durchgeführt, bei denen der X- und Y-Bereich über eine gleichmäßige Verteilung von 0 bis 1 verlaufen. Wir haben auch die Korrelation zwischen X und Y variiert, aber das war nicht sehr wichtig. In jeder Simulation lagen die meisten Werte von X / Y nahe bei 1, während einige wenige viel größer und noch weniger extrem groß waren. Dieses Ergebnis bestätigt die Idee, dass die Division eine stark verzerrte Verteilung ergibt. Schräg in einem

P. Heck
Positive (rechts) Schräglage, wenn X und Y negativ korreliert sind.
Quelle: P. Heck

Variable drückt Korrelationen mit anderen Variablen. Für positiv korrelierte Werte von X und Y ( r = .5) finden wir eine Korrelation zwischen X und dem Verhältnis X / Y von -021, und für ein negativ korreliertes X und Y finden wir .152. Die Grafiken auf der linken Seite zeigen die zwei Streudiagramme, in denen X / Y als Funktion von X dargestellt ist. Die meisten der Verhältnisse befinden sich im untersten Bereich der Skala, während es eine Reihe von Ausreißern gibt. Wenn X und Y positiv korreliert sind, ist die Verteilung von X / Y linkssymmetrisch; Wenn die Korrelation negativ ist, ist sie richtig verzerrt.

Man könnte versucht sein, zu dem Schluss zu kommen, dass ein Mangel an Korrelation einen Beweis für die Unabhängigkeit darstellt. Eine solche Schlussfolgerung wäre hastig, weil die Verzerrung die wahre Assoziation maskieren könnte. Eine Standardkorrektur besteht darin, eine schiefe Variable logarithmisch zu transformieren, bevor sie mit anderen Variablen korreliert wird. Wenn wir die Werte logarithmisch transformieren, eliminieren wir den übermäßigen Einfluss großer entfernter Elemente und es entsteht eine positive Assoziation zwischen dem Zähler X und dem vollen Verhältnis X / Y. Der zweite Satz von zwei Figuren zeigt dies. Für positiv korrelierte Werte von X und Y ( r = .5) finden wir eine Korrelation zwischen X und dem Verhältnis X / Y von. 514, und für ein negativ korreliertes X und Y finden wir .831. Diese Korrelationen sind ziemlich groß und verleihen der Ansicht Glaubwürdigkeit, dass die Division dem, was der Zähler bereits ausführt, wenig hinzufügt. Die Division addiert mehr, wenn die Korrelation zwischen X und Y zunehmend positiv wird. Dies ist interessant, weil dies bedeutet, dass das "Relativieren" einer Variablen X durch Dividieren durch die Variable Y am aussagekräftigsten ist, da die Unterschiede zwischen ihnen (zwischen einem Abtastwert von X und einem Abtastwert von Y) kleiner werden.

P. Heck
Lineare Beziehung, die nach der Protokollumwandlung auftritt
Quelle: P. Heck

Die Schieflage der Verhältnisverteilung hat eine weitere problematische Konsequenz. Wir wissen, dass das arithmetische Mittel wahrscheinlich höher ist als der konzeptionelle Mittelpunkt von 1.0, den wir bekommen würden, wenn X = Y. Da es möglich ist, ein Verhältnis von X / Y> 2 zu erhalten, aber unmöglich eins <0 zu erhalten, die meisten Stichprobenmittelwerte sind> 1. In einer symmetrischen Verteilung ist der Mittelwert eine unverzerrte Schätzung des wahren Durchschnitts (dh der Mittelwert einer unendlich großen Stichprobe); es ist weder systematisch zu klein noch zu groß und variiert nicht systematisch in Abhängigkeit von der Stichprobengröße. Dies ist bei einer verzerrten Verteilung nicht der Fall. In einer verzerrten Verteilung wird der Mittelwert

P. Heck
Starke lineare Assoziation zwischen X und X / Y.
Quelle: P. Heck

größer wird, wenn die Stichprobengröße N zunimmt, da größere Stichproben wahrscheinlicher machen, dass sehr seltene aber sehr große Werte (hier Verhältnisse) erfasst werden. Wenn sie gefangen werden, ziehen sie den Mittelwert hoch. Da wir wissen, dass ein Verhältnis in die Unendlichkeit driften kann, da der Nenner unendlich klein wird, wissen wir auch, dass eine sehr sehr große Stichprobe sehr wahrscheinlich einen Mittelwert ergeben wird, der praktisch, praktisch oder moralisch unendlich ist. Wir möchten nicht, dass das passiert, weil das Ergebnis nicht interpretierbar wäre.

Um den Anstieg des Mittelwerts als eine Funktion von N zu veranschaulichen, führten wir eine Reihe durch

P. Heck
Der Verzerrungseffekt der Stichprobengröße auf das erwartete mittlere Verhältnis.
Quelle: P. Heck

von Simulationen. Die letzte Figur zeigt die X / Y-Abtastmittel, die über 1000 Simulationen für jede der 7 Probengrößen auf einer logarithmischen Skala berechnet wurden. Beachten Sie, dass das mittlere Verhältnis steigt, ebenso wie die Genauigkeit, mit der es geschätzt wird (die Balken um jeden Mittelwert drücken den Standardfehler aus, der die Standardabweichung der Stichprobenmittel dividiert durch die Quadratwurzel ihrer Anzahl ist).

Es gibt keinen Grund, alle Hoffnung und alle Verhältnisse aufzugeben. Aber in vielen psychologischen Kontexten ist es eine gute Übung zu fragen, ob so viel wie erhofft gewonnen wurde. Man möchte die Verwendung von Verhältnissen nach der Tat nicht rationalisieren. Wir empfehlen, Kennzahlen mit ihren Inhaltsstoffvariablen anzugeben, um die absoluten Werte zu schätzen, aus denen die Kennzahlen entstanden sind. Und natürlich sind einige Verhältnisse schön, wie das goldene auf dem Bild oben. Den Kreis schließen – wenn man eine geometrische Metapher zulässt – Fra Luca Pacioli, der große Mathematiker der Renaissance, bemerkte: "Wie Gott ist die göttliche Proportion immer sich selbst ähnlich".

Krüger, JI (2008). Die robuste Schönheit der einfachen Assoziationen. In JI Krueger (Hrsg.), Rationalität und soziale Verantwortung: Essays zu Ehren von Robyn M. Dawes (S. 111-140). New York, NY: Psychologie-Presse.

McCauley, C., und Stitt, CL (1978). Ein individuelles und quantitatives Maß für Stereotypen. Zeitschrift für Persönlichkeits- und Sozialpsychologie, 36 , 929-940.

McNemar, Q. (1969). Psychologische Statistik (4. Aufl.). New York, NY: Wiley.

Posner, M. (1973). Kognition: Eine Einführung . Glenview, Ill .: Scott, Foresman.