Ein Vorurteil der Mittelung

Die Liebe zur Voreingenommenheit ist – wieder – nicht wiedergegeben.

“Παν μέτρον άριστον. [Alles in Maßen.] “- Leoboulos von Lindos, zugeschrieben, 6. Jahrhundert v

Die Fähigkeit, gemittelte Daten zu mitteln, ist für eine effektive Wahrnehmung und Entscheidungsfindung unerlässlich. Schüler, die mit der Gaußschen Fehlerverteilung vertraut sind, werden verdorben, weil diese Verteilung nicht nur normal, sondern auch schön ist. Die Tatsache, dass es unterschiedliche Maßeinheiten für die ” zentrale Tendenz ” gibt, ist noch nicht angekommen, da sie bei Gauß alle gleich sind: der Durchschnitt (das arithmetische Mittel), der Modus (der Peak) und der Median (das 50. Perzentil) ). Wenn die Schräglage eingeführt wird, sind die drei Wege möglich. Bei einer negativ verzerrten Verteilung (mit dem dünnen Schwanz links) und mit von links steigenden Zahlen ist der Modus größer als der Median, der größer als der Durchschnitt ist.

Wenn Forscher den Teilnehmern eine Reihe von Zahlen vorlegen und sie bitten, den Durchschnitt einzuschätzen, erklären sie gut die drei Arten der zentralen Tendenz und machen klar, welche von ihnen sie suchen. Oft scheinen die Forscher anzunehmen, dass die Forderung nach einem “Durchschnitt” als “arithmetischer Mittelwert” verstanden wird. Wenn die Durchschnittsschätzungen von den tatsächlichen Durchschnittswerten abweichen, schließen die Forscher, dass etwas Interessantes im Gange ist.

Wenn Durchschnittsschätzungen immer die wahren Durchschnitte gut treffen, wäre die Psychologie nicht groß (Peterson & Beach, 1967). Unstimmigkeiten werfen Fragen auf, was die Leute tatsächlich tun, um die Aufgabe zu lösen und wie sie modelliert werden. Parducci (1965) präsentierte eine einfache und elegante Mittelwertbildung. Nach seiner Range-Frequency-Theorie (RFT) ergeben sich Durchschnittsschätzungen aus einem Kompromiss zwischen einem Range-Prinzip und einem Rank-Prinzip . Das Range-Prinzip nimmt die Mitte zwischen dem kleinsten und dem größten beobachteten Wert und das Rang-Prinzip den Median. Wenn sich die beiden unterscheiden, teilen Sie die Differenz auf. RFT hat einen guten Erfolg bei der Vorhersage der menschlichen Leistung bei der Mittelwertbildung in einer Vielzahl von Kontexten (Wedell & Parducci, 2000).

Von Zeit zu Zeit versuchen Forscher, RFT neu zu erfinden oder zu verbessern – mit begrenztem Erfolg. In einem früheren Aufsatz (Krueger, 2018) habe ich die Bemühungen eines Harvard-Teams beschrieben, ein neues Konzept der Kategorieweiterung einzuführen, nur um herauszufinden, dass RFT die Daten gut beschreibt, ohne einen neuen psychologischen Prozess zu erfordern, geschweige denn “Vorurteile”.

Nun berichten Forscher von Yale und Cornell über binäre Bias , eine angeblich gemittelte Heuristik, die zu systematischen Fehlern führt (Fisher & Keil, 2018; Fisher et al., 2018). Die psychologische Sünde du Jour ist Dichotomisierung. Die Mittelwertbildung ist schwer, und man nimmt an, dass die Befragten den Bereich der beobachteten Werte in eine linke und eine rechte Hälfte unterteilen (rufen Sie das Entfernungsprinzip auf), und schätzen dann die Anzahl der Beobachtungen in jeder Hälfte und subtrahieren Sie eine Zahl von der anderen, um anzukommen bei einem Ungleichgewicht. Dies klingt sehr nach RFT, weil es das Reichweitenprinzip (durch Verwendung des halben Bereichs als Kriterium der Dichotomisierung) und das Rangprinzip (durch Verwendung von Verteilungsversatzvariationen) aufgreift. Tatsächlich prognostiziert das kritisch abhängige Maß, der Ungleichgewichtswert , Schätzungen des Durchschnitts über den gesamten Bereich. Überraschenderweise ist das Rechenmodell für die binäre Neigung jedoch stumm, wie sich der Ungleichgewichtswert in einen geschätzten Durchschnitt umsetzt. es sagt nur voraus, dass die beiden über Verteilungspaare korreliert sind.

J. Krueger

Eine Geschichte von 2 Menüs

Quelle: J. Krueger

Um die binäre Vorspannungshypothese zu testen, konstruieren die Autoren Verteilungspaare, bei denen die beiden Mittelwerte gleich sind, der Versatz jedoch unterschiedlich ist. Jetzt wirkt sich der Versatz sowohl auf die Ungleichgewichtsbewertung als auch auf den Median aus und führt zu einer Verwirrung der beiden Werte. Betrachten Sie das Beispiel der beiden Menüs (in der ersten eingefügten Abbildung). Es gibt 10 Menüpunkte. Die Preise reichen von $ 12 bis $ 20 in Menü 1 und von $ 10 bis $ 17 in Menü 2. Der mittlere Bereich beträgt also $ 16 in Menü 1 und $ 13,5 in Menü 2. In Menü 1 sind 7 Artikel günstiger als der Midrange-Preis und 3 sind teurer. Dies führt zu einer Ungleichgewichtsbewertung von 4 (7 – 3). In Menü 2 sind 2 Elemente teurer als der Mitteltöner, und 8 sind billiger. Dies führt zu einem Ungleichgewicht von -6 (2 – 8). Die Prognose lautet, dass die Befragten für Menü 1 einen niedrigeren Durchschnittspreis als für Menü 2 schätzen werden und dies tatsächlich tun. Et voilà , Fehler ergibt Fehler.

Der Median zeigt jedoch die gleiche Ungleichung. Die Preisverteilung für Menü 1 ist positiv verzerrt (wobei die meisten Gerichte billig sind), während die Verteilung für Menü 2 nicht verzerrt ist. Der Durchschnittspreis in Menü 1 beträgt 14 $ und der Durchschnittspreis in Menü 2 beträgt 16 $. Dieser Teil von RFT geht es gut. Wenn die Befragten jedoch bei der Schätzung der Durchschnittswerte dem Median- und dem Midrange-Preis das gleiche Gewicht gaben, wäre der geschätzte Durchschnittswert für Menü 1 etwas höher als der geschätzte Durchschnittswert für Menü 2.

Die Möglichkeit, dass die Befragten einfach den Medianwert einnehmen, wenn sie den Durchschnitt schätzen, ist eine plausible psychologische Alternative. Die Autoren stellen immer wieder die Konfusion zwischen binärer Neigung und medianisch gesteuertem Urteil fest, tun aber wenig, um sie zu brechen. Der direkteste Test findet sich in Studie 7 von Fisher et al. (2018). Hier finden wir 3 Arten von Verteilungspaaren. In allen drei Paaren hat die Verteilung mit dem positiven Versatz einen etwas niedrigeren Mittelwert als die Verteilung mit dem negativen Versatz. Da Zahlen in diesem Experiment einen Wert haben, sollten alle Befragten aus der letzteren Verteilung wählen; die meisten jedoch nicht, was mit der binären Vorspannung übereinstimmt. Die Ergebnisse sind praktisch gleich, wenn die 5 Behälter von “sehr schlecht” bis “sehr gut” gekennzeichnet sind. Hier stimmt der halbe Bereich mit dem neutralen Label überein. In der dritten Bedingung finden die Befragten jedoch eine einwertige Skala, die von “fair” (1) bis “extrem gut” (5) reicht. Etwa die Hälfte dieser Befragten bevorzugt immer noch die Verteilung mit dem niedrigeren mittleren, aber positiven Skew. Die Autoren schlussfolgern, dass bei einem Versatz der Fehlerquelle die Einführung von Etiketten keine Rolle spielt.

Dies ist eine kuriose Möglichkeit, konkurrierende Hypothesen voneinander zu trennen. Die Einführung von Labels von „fair“ (1) bis „extrem gut“ (5) führt zu einem neuen Wettbewerb sowohl für die binäre Verzerrung als auch für das Skew-Konto. In diesem Zustand hat sich die semantisch vorgeschlagene Kategoriengrenze von 3 auf 1,5 verringert. Es besteht nun ein starker Bedarf, alle Ratings, die das Wort “gut” enthalten, in Gruppen zusammenzufassen. Und wie sich herausstellt, hat die Verteilung mit dem niedrigeren Durchschnitt weniger “faire” Artikel als die Verteilung mit dem höheren Durchschnitt. Dieser Test ist nicht stark, weil er damit einverstanden ist, dass ein signifikanter Effekt die Hypothese widerlegt, die keinen Effekt vorhersagt (Krueger & Heck, 2017). Durch den Einsatz einer starken, nachfragevorschlagenden Manipulation wird das Deck gestapelt. Angesichts der Bedeutung von Bedeutung wird leicht übersehen, dass selbst unter diesen dringenden Umständen die meisten Antworten den Antworten in den beiden anderen Bedingungen ähnelten und sich nicht von diesen unterschieden.

J. Krueger

Lass es Steak geben!

Quelle: J. Krueger

Obwohl dieser Test nicht so schlimm ist, muss er als schwach betrachtet werden, wenn er aufgefordert wird, die gesamte Arbeit zu erledigen. Es ist nicht schwer, einen anderen, komplementären Weg zu finden, um die binäre Verzerrungshypothese gegen die Skew-Hypothese zu stellen. Kommen wir zum Menü-Paradigma zurück und fügen Sie zu jeder Liste einen teuren Gegenstand (Ribeye-Steak für 30 US-Dollar) hinzu. Die zweite Abbildung zeigt, dass die Durchschnittswerte gestiegen sind und die zweite Liste einen höheren Durchschnittspreis beibehält. Kritisch ist der Ungleichgewichtsfaktor jetzt ausgeglichen, so dass keine binäre Verzerrung vorhergesagt wird. Die RFT sagt unter Verwendung von Informationen zur halben Reichweite und zum Rang einen winzigen Unterschied voraus.

Mit etwas mehr Forschung könnten wir dann herausfinden, ob wir das neuartige Konzept der binären Neigung brauchen. Der irreführende Reiz dieser Forschung besteht zum Teil darin, dass sie die unumstrittene Beobachtung verwendet, dass Menschen spontane kontinuierliche Reize kategorisieren (Krueger & Clement, 1994; Tajfel, 1969), um zu behaupten, dass diese Tendenz eine kategorialübergreifende Kognition wie zB grand einschränkt Mittelwertbildung

Verweise

Fisher, M. & Keil, FC (2018). Die binäre Vorspannung: Eine systematische Verzerrung bei der Integration von Informationen. Psychologische Wissenschaft . DOI: 10.1177 / 09567718792256

Fisher, M., Newman, GE & Dhar, R. (2018). Sterne sehen: Wie die binäre Verzerrung die Interpretation von Kundenbewertungen verfälscht. Journal of Consumer Research . DOI: 10.1093 / jcr / ucy017

Krueger, JI (2018, 16. Juli). Soziale Probleme und menschliche Erkenntnis. Psychologie heute online . https://www.psychologytoday.com/intl/blog/one-among-many/201807/social-problems-and-human-cognition

Krueger, J. & Clement, RW (1994). Gedächtnisbasierte Beurteilungen über mehrere Kategorien: Eine Überarbeitung und Erweiterung der Akzentuierungstheorie von Tajfel. Zeitschrift für Persönlichkeits- und Sozialpsychologie, 67 , 35-47.

Krueger, JI & Heck, PR (2017). Der heuristische Wert von p in der induktiven statistischen Inferenz. Grenzen in der Psychologie: Pädagogische Psychologie [Forschungsthema: Erkenntnistheoretische und ethische Aspekte der sozialwissenschaftlichen Forschung] . https://doi.org/10.3389/fpsyg.2017.00908

Parducci, A. (1965). Kategoriebewertung: Ein Range-Frequency-Modell. Psychological Review, 72 , 407–418.

Peterson, CR & amp; Beach, LR (1967). Der Mensch als intuitiver Statistiker. Psychological Bulletin, 68 , 29–46.

Wedell DH & amp; Parducci A. (2000). Sozialen Vergleich. In: J. Suls & L. Wheeler (Hrsg.), Handbuch zum sozialen Vergleich: Theorie und Forschung (S. 223-252). New York: Plenum / Kluwer.

Tajfel, H. (1969). Kognitive Aspekte von Vorurteilen. Journal of Social Issues, 25 , 79–97.