Scheinkorrelationen von Tyler Vigen: Eine Buchbesprechung

Tyler Vigens Buch, Spurious Correlations , ist warm, lustig und macht einige sehr wichtige Punkte. Laut Vigen basiert sein Buch auf Dutzenden von Korrelationen zwischen völlig unabhängigen Datensätzen. Er verließ sich auf einen Computer, um zufällige Pearson-Produkt-Moment-Korrelationen (r) zwischen solchen bedeutungslosen Variablen wie der öffentlichen Highschool-Einschreibung und dem Konsum von Sauerrahm zu erzeugen. Und tatsächlich ist der Zusammenhang zwischen der öffentlichen Einschulung und dem Verzehr von Sauerrahm recht hoch, r = .95. Dies ist nicht nur zufällig und bedeutungslos, sondern das größere Problem ist, dass wir jeden Tag Unsinn wie diesen sehen und die Menschen Schlussfolgerungen auf diese Zusammenhänge stützen. Zum Beispiel bin ich besorgt über die Einschulung. Bedeutet diese hohe Korrelation, dass wenn ich mehr Sauerrahm esse, mehr Kinder in der Schule bleiben?

Vigens Buch macht viel Spaß, denn er hat fast zweihundert dieser albernen, zufälligen Korrelationen, die aus seriösen Datenbanken stammen. Wenn zum Beispiel Daten vom CDC-Zentrum mit Daten aus der Internet Movie Database korrelieren, fand er, dass Ben Afflecks Filmauftritte eine sehr hohe Korrelation mit versehentlichen Vergiftungen durch Pestizide haben, r = .92. Bedeutet dies, dass Filme von Ben Affleck unbeabsichtigte Vergiftungen durch Pestizide verursachen? Natürlich nicht. Wie jeder psychologische Hauptpsychologe weiß, bedeutet Korrelation keine Kausalität. Eine Korrelation ist einfach eine mathematische Beziehung zwischen zwei Datensätzen. Es bedeutet, dass zwei Variablen zusammen oder kovariieren.

Während Spaß und albern, zeigt dieses Buch viele wichtige Prinzipien. Zusammen mit 1) seien Sie vorsichtig in Ihrer Dateninterpretation und 2) Korrelation bedeutet nicht Kausalität ist das dritte Konzept der Scheinkorrelation. Vigens Buch trägt den Titel "Scheinkorrelationen". Streng genommen ist eine Scheinkorrelation dann gegeben, wenn die Beziehung zwischen Variablen mit einer starken Korrelation durch eine dritte Variable erklärt wird. Hier wird Vigens Buch noch interessanter. Hier ist ein weiteres Beispiel. March Madness TV Werbeeinnahmen und Brauereien in den Vereinigten Staaten korrelieren .94. So wie Werbeeinnahmen steigen, so Brauereien. Könnten beide durch eine boomende Wirtschaft erklärt werden? Eine bessere Wirtschaft führt dazu, dass mehr Geld für alles ausgegeben wird, einschließlich Fernsehwerbung und Brauereien. Und dies deutet auf ein anderes sozialwissenschaftliches Prinzip hin, das Gesetz des Parsentismus. Das Gesetz des Parsimons besagt, dass, wenn Dinge nicht eindeutig sind, die einfachste Erklärung, die die meisten Beobachtungen erklärt, die beste ist.

Hmmm …., Jetzt werden die Dinge kompliziert. Es reicht nicht aus, eine Korrelationsbeziehung zwischen Variablen zu beobachten und zu einer Schlussfolgerung zu springen. Leider passiert dies die ganze Zeit und deshalb ist dieses Buch eine großartige Ergänzung zu einer formalen Klasse in der Statistik. Wie dem auch sei, es wird offensichtlich, dass es in der Sozialwissenschaft um Logik geht und nicht nur um zufällige computergenerierte Korrelationen. Wir verwenden deduktives Denken, um Hypothesen zu bilden, induktives Denken, um die Hypothesen zu testen, und reproduzieren sorgfältig unsere Ergebnisse, bevor wir voreilige Schlüsse ziehen. Sozialwissenschaftliche Forschung ist grundsätzlich eine Übung in der Logik. Leider geschieht dies im Zeitalter der Big Data nicht genug. Täglich sind wir mit Daten überfordert. Ich kann nicht einmal eine Schokolade von Sees essen, ohne zu wissen, wie viele Kalorien es kostet. Wissenschaftler rasen, um Ergebnisse zu veröffentlichen, und negative Ergebnisse werden nicht einmal veröffentlicht. Medien und Lehrer erfassen den schnellsten Schluss und verbreiten ihn wie Klatsch oder Kinder beim Telefonieren. Alles passiert sehr schnell ohne viel kritisches Denken oder Nachdenken. Und genau deshalb ist Vigens Buch so wichtig. Indem er sich über bedeutungslose Zusammenhänge lustig macht, macht er auf schlampiges Denken aufmerksam. Lesen Sie dieses Buch aus Spaß und halten Sie inne und denken Sie über die Konsequenzen für all die bedeutungslosen Schlussfolgerungen nach, die wir jeden Tag bilden.