Wie Cambridge Analytica Daten für den Einfluss der Wähler auswertete

Warum persönliche Daten mit Fehlinformationen zu sammeln, ist eine große Sache.

Wenn wir auf die Verwendung von Social Media Analytics bei Obamas Wahlen zurückblicken, könnten wir uns fragen, wie sich die Trump-Kampagne mit der Forschungsfirma Cambridge Analytica anders verhält? Geht es darum, dass Cambridge Analytica gegen die Facebook-Richtlinien verstößt oder ist das eine größere Sache?

Im Januar 2013 schrieb ich darüber, wie Präsident Obama in den Präsidentschaftskampagnen 2008 und 2012 effektiv soziale Medien nutzte. Er verglich die Social-Media-Kenntnisse seines Teams mit Kennedys Fähigkeit, das Fernsehen zu nutzen. Während Kennedy viele angeborene Talente wie Charisma und gute Haare hatte, die es ihm ermöglichten, zu Hause gut über die Linse auf die TV-Bildschirme zu projizieren, setzte Obamas Team Sozialpsychologie mit Social Media ein. Im Jahr 2016 wandten sich die Leute von Trump an Daten.

Pamela Rutledge/Shutterstock

Quelle: Pamela Rutledge / Shutterstock

Wir sind jetzt im Zeitalter der Datenwissenschaft. Die Fähigkeit, Daten von mehreren Social-Media-Plattformen zu scrappen und Verhaltensmuster und Kommentare von Nutzern zu erfassen, ist beispiellos. Es hat eine große Nachfrage nach erstklassigen Datenwissenschaftlern hervorgebracht, die herausfinden, wie man riesige Datenmengen sammelt und analysiert, Algorithmen erstellt, die aussortieren und darauf reagieren, und Vorhersagemodelle erstellen. Ihre Toolbox ist eine beeindruckende Mischung aus maschinellem Lernen, Statistik, robusten Programmierfähigkeiten sowie künstlicher und natürlicher Intelligenz – und alle versuchen, das menschliche Verhalten auf immer feinere und zielgerichtetere Weise zu erfassen und zu beeinflussen.

Welche Vergleiche zwischen Obama und Trump auch immer entstehen mögen, sie sind ein roter Faden. Im Mittelpunkt dieser sehr öffentlichen Debatte steht der Zugang zu und die Nutzung von Daten. Dieses Zeug geht nicht weg. Es wird nur anspruchsvoller und allgegenwärtig. Es ist weder schlecht noch gut. Dies ist ein wichtiger Lehrmoment – eine Gelegenheit, einige der wichtigsten ethischen und rechtlichen Fragen rund um das Data Mining besser zu verstehen -, wenn wir nicht in den Hasen der politischen Fingerzeige fallen.

Dennoch werden viele Vergleiche ziehen wollen. Vier Jahre sind buchstäblich ein Leben lang in der Evolution der Datenwissenschaft. Die Fähigkeiten und das soziale Klima sind beide anders als 2008 und 2012. Die Werkzeuge und die Fähigkeit, Daten zu schaben und auszuwerten, sind jetzt viel ausgefeilter – sowohl auf technologischer als auch auf theoretischer Ebene – als das, was Obamas Team konnte benutzen.

Aber noch wichtiger ist, dass sich das soziale Klima und damit auch das Bewusstsein für Datenverstöße und das Verständnis der Verwendung von Daten zur Verletzung der Privatsphäre, einschließlich erhöhter ethischer Richtlinien und Vorschriften, geändert haben. Den Menschen wird zunehmend bewusst, wie Datenalgorithmen basierend auf unseren Online-Verhaltensweisen verwendet werden, von Amazon-Empfehlungen bis hin zu gezielten Anzeigen, die uns von Website zu Website folgen. Transparenz, Erlaubnis und Wahrung der Privatsphäre – zur Sicherheit und zur Vermeidung von Manipulationen – waren allesamt wichtige Themen von Hinweisgebern und gesellschaftlichem Diskurs.

Eines der großen Probleme bei der Cambridge Analytica-Kontroverse ist die Frage, wie die Daten gesammelt wurden. Berichten zufolge forderte die Cambridge Times in der New York Times und anderswo persönliche Informationen über eine App mit irreführender Offenlegung des Zwecks und der Absicht. Die verschiedenen Arten von Informationen, von denen einige harmlos erscheinen, wie College-Majors und politische Zugehörigkeit, wurden angefragt, aber die App enthielt auch Fragen zur Persönlichkeitsbeurteilung, um Persönlichkeitsprofile zu erstellen.

Nun, warum ist das eine große Sache? Wir wissen bereits, dass es möglich ist, ein Persönlichkeitsprofil aus einer Reihe von Textdaten zu schätzen oder das Facebook-Profil von jemandem zu kodieren, wie Forscher gezeigt haben. Das Problem ist, dass es schwierig ist, dies in großem Maßstab zu tun. Sie müssen eine erhebliche Menge an Text von jedem Teilnehmer haben, was für eine Gruppe jeder Größe extrem kostspielig und arbeitsintensiv wird. Wo Psychoforscher eine Gruppe von 200 Teilnehmern betrachten können und als Venusmuscheln mit ihrer Verallgemeinerbarkeit glücklich sein können, ist dies nicht für die Überzeugungskraft des Wählers geeignet. Der Wunsch, Zielgruppen psychologisch zu profilieren, hat jedoch großen Reiz, da er wertvolle Informationen liefert, die derzeit nicht öffentlich zugänglich sind. Verschiedene Forschungsfirmen arbeiten an Lösungen, die analytische Techniken wie Natural Language Processing oder die Nutzung der Leistungsfähigkeit von Watson von IBM nutzen, aber derzeit entweder in kleinen Gruppen für HR-Zwecke (mit teilnehmender Erlaubnis) oder in aggregierter Form, “blind” zu individuellen Identitäten. Noch wichtiger sind jedoch Schätzungen – zugegebenermaßen sind einige besser als andere -, aber sie sind nicht dasselbe wie ein Persönlichkeitsprofil, das man erhält, wenn man validierte psychologische Testmaßnahmen durchführt. (FYI – einige argumentieren, dass Persönlichkeitstests Selbstangaben sind, sie sind tatsächlich weniger genau als Profile, die anhand von Daten geschätzt werden, aber ich überlasse das denjenigen, die mehr Erfahrung in den Bewertungsgräben haben, um zu kämpfen.)

Es ist überflüssig zu sagen, dass es sehr viel einfacher ist, Persönlichkeitsprofile einer ganzen Reihe von Menschen zu bekommen, wenn ein Unternehmen die Leute dazu bringen kann, einen Persönlichkeitstest zu machen. Wenn sie den Leuten nicht sagen, wofür es ist, muss sich das Unternehmen keine Sorgen machen, dass die Teilnehmer ihre Antworten auf “gut aussehen” für ihre Zwecke verzerren. Ein paar wenige Schlüsselfragen und Zugriff auf Social-Media-Handles lassen den App-Entwickler die Daten von Social-Media-Accounts abkratzen (was die App seit der Eingabe des Nutzers zur Nutzung der App getan hat), es ist für einen Crack-Data-Scientist einfach, zu verlinken Persönlichkeitsprofile mit Vorlieben, Abneigungen, politischen Positionen, Identifizierung von Freunden und Erstellung von Vorhersagemodellen.

Jetzt haben sie die Fähigkeit, Individuen auf psychologische Merkmale auszurichten, nicht nur auf “Lifestyle-Variablen” wie Filmpräferenzen. Ehrlich gesagt, Marketer würden das gerne tun, aber sie tun es nicht. Es ist nicht nur schwierig, persönliche Präferenzdaten mit zielgerichteten Benutzerdaten zu verknüpfen, ohne gegen die Datenschutzbestimmungen und ethischen Standards der Social Media-Unternehmen zu verstoßen, sondern sie haben auch nicht die Ergebnisse von legitimen Persönlichkeitstests. Unternehmen wie Twitter schützen beispielsweise eifrig die individuelle Benutzeridentifikation in Daten, die Anfragen aus Marketing– und politischen Kampagnen entsprechen. Cambridge Analytica nutzte die Tatsache, dass die meisten von uns sich in eine App einloggen und private Informationen weitergeben, wenn wir uns sicher fühlen. Auf Facebook zu werben und den Leuten zu sagen, dass es für akademische Forschung war, gaben ihnen das Gefühl, sicher zu sein. Also die rechtliche Frage: Zählt es, wenn die Erlaubnis unter falschen Vorwänden gegeben wurde?

In den Jahren 2008 und 2012 nutzte sein Team während Obamas Kampagne öffentlich zugängliche Profile. Wenn Sie Obama auf Facebook anfreundten, gaben Sie ihm Ihre Daten und zeigten ihm, wer Ihre Freunde waren. Es ist im Kleingedruckten. Lies es einige Zeit. Die vom Benutzer bereitgestellten Daten ermöglichten es ihnen, mögliche Prädispositionen für Richtlinien zu identifizieren, die mit anderen verfügbaren Daten, wie z. B. Postleitzahlen, übereinstimmen.

Menschen machen ständig Vorhersagen aus Informationen. Wenn wir unsere eigenen Erfahrungen verwenden, nennt man das eine Heuristik. Mit einer Menge Informationen und Mathe heißt es Data Science. Die Frage ist Genauigkeit. Selbst mit den Daten, die Cambridge gesammelt hat, ist ihre Fähigkeit, Menschen zu beeinflussen, keine sichere Sache oder hat die Fähigkeit, die Kultur zu stören, wie manche behauptet haben. Aber persönliches Targeting macht die Überredung wahrscheinlicher und Targeting ohne Erlaubnis ist, lasst uns ehrlich sein, irgendwie gruselig. Obamas Team war zu der Zeit ziemlich ausgereift, aber nicht mehr als Google, Amazon oder andere datengetriebene kommerzielle Unternehmen. Obamas Kampagne war das erste Mal, dass Social-Media-Marketing-Techniken auf die Politik angewandt wurden. Die Aufmerksamkeit kam nicht von der Raffiniertheit ihres Targetings, sondern von Obamas Fähigkeit, seine Persönlichkeit in sozialen Netzwerken zu nutzen, um eine Grassroots-Begeisterung zu aktivieren und die Kampagnenkassen effektiv zu crowsourcen.

Was wir immer noch nicht wissen ist, was hat die Trump-Kampagne Cambridge mit ihren Daten zu tun? Diese Geschichte wird sich entfalten. Menschen mögen es jedoch nicht manipuliert zu werden. Sie erinnern sich vielleicht an die öffentliche Reaktion von Facebook auf das Experimentieren mit den positiven und negativen Nachrichten, um zu sehen, ob die Wertigkeit des Inhalts den allgemeinen Ton und die “Stimmung” verändert hat – und zwar weitgehend in aggregierter Form und nicht für individuelles Targeting. Es wird interessant sein zu sehen, ob die Leute die Möglichkeit einer Manipulation offensiv finden oder ob sie verschiedene Dinge entlang der Parteilinie beschriften.

Jeder Politiker sucht nach dem, was bei den Wählern ankommt. Die Verwendung von Social-Media-Daten und Wählerprofilen in den Wahlen 2012 scheint im Vergleich zur Datenauswertung von Cambridge Analytica nahezu gesund zu sein. Aber das ist das erste Mal (das wir wissen), dass Daten für politische Zwecke erbeten wurden, indem Fehlinformationen verwendet wurden, um Menschen zur Offenlegung zu verleiten. Dies löst einen ernsten Hot-Button für viele aus, angesichts der Menge an Fehlinformationen, die während und seit der Trump-Clinton-Wahl herumgewirbelt haben. Jeder ist gegenüber falschen Nachrichten überempfindlich, unabhängig von ihrer politischen Überzeugung. Zu wissen, dass Fehlinformationen die Wurzel dieser Datenerhebung waren, wird die Verletzung für viele noch ungeheuerlicher erscheinen lassen, besonders angesichts der kognitiven Verzerrung, die uns Verhaltensweisen oder Absichten zuweist, die auf vergangenen Erfahrungen basieren. (Wenn sie auf A betrogen haben, werden sie wahrscheinlich auf B schummeln, wenn sie auf B betrogen haben, müssen sie auf A geschummelt haben.) Das ist nicht rational, aber manipuliert bewegt Menschen von einer vertrauenden zu einer defensiven und verdächtigen Position.

Traurigerweise manifestiert sich dies alles in einer Menge Schuldzuweisungen und wir haben immer jemanden, dem wir die Schuld geben können. In diesem Fall sieht es so aus, als würden die Füße von Facebook zusammen mit Cambridge Analytica in die Flammen geführt. Ich bezweifle ernsthaft, dass Facebook etwas getan haben könnte, um eine Organisation davon abzuhalten, ihre Absichten falsch darzustellen. Ironischerweise für Facebook, die Stärke ihrer Marke implizit validiert die App.