Der neue Bereich der Social Data Analytics bietet uns mehr Ressourcen als je zuvor, um soziale Phänomene zu untersuchen. Eines meiner Lieblingsbeispiele, wie das neue Feld der Social Data Analytics angewendet wird, ist eine schöne Studie von Microsoft Research aus dem Jahr 2013 [1] . Durch die Analyse der Twitter-Feeds von Schwangeren könnten die Forscher vorhersagen mit 80% Genauigkeit wenn eine Frau eine postpartale Depression entwickeln würde.
Sie begannen mit der Rekrutierung von fast 400 Frauen zur Teilnahme. Von Twitter sammelten sie Daten, darunter die Texte der Frauentweets, ihre Favoriten und Antworten. Sie haben dann vier Verhaltensweisen gemessen:
Nach dem Aufbau einer Liste von Attributen wurden die Frauen auf Anzeichen einer postpartalen Depression (PPD) überwacht. Während sich das gesamte Verhalten der Frauen im Laufe ihrer Schwangerschaft änderte, änderten sich die Frauen, die später PPD erhielten, auf unterschiedliche Weise. Die Forscher bauten Computermodelle, die diese kleinen Unterschiede nutzten. Diese Computermodelle könnten dann den Twitter-Feed einer Person betrachten und abschätzen, ob sie mit der Entwicklung von PPD fortfahren würde oder nicht.
Unter Verwendung nur Daten von vor der Geburt der Frauen, konnten ihre Modelle Frauen mit einer Genauigkeit von 70% genau als wahrscheinlich identifizieren, um PPD zu entwickeln oder nicht. PPD entwickelt sich jedoch typischerweise etwa einen Monat nach der Geburt. Als die Forscher in den ersten Wochen nach der Geburt hinzufügten, bevor die PPD-Symptome sich zu entwickeln begannen, wurden die Algorithmen sogar noch besser und erreichten eine Genauigkeit von 80% oder höher.
Inwiefern hat sich das Twitterverhalten der Frauen verändert? Frauen, die fortfuhren, PPD zu entwickeln, tendierten dazu, ihre Tweet-Häufigkeit und Anzahl von Anhängern sowie ihre Verwendung von Personalpronomen der 2. und 3. Person ("er", "sie", "du") zu verringern, während diejenigen, die es taten nicht entwickeln PPD tatsächlich in allen Kategorien erhöht .
Auf der anderen Seite neigten Frauen, die PPD entwickelten, dazu, mehr Fragen zu stellen, während Frauen, die die Fragen nicht gestellt hatten, weniger Fragen stellten.
Die interessante wissenschaftliche Erkenntnis ist, dass dies alles subtile Hinweise sind, die nicht direkt Ausdruck von PPD sind. Es bedeutet, dass Frauen, selbst wenn sie versuchen, ihre potentielle Situation zu verbergen, dies zumindest aus dem Algorithmus wahrscheinlich nicht erfolgreich tun können.
Als diagnostisches Werkzeug für Ärzte ist diese Technik sehr vielversprechend. Es ist nicht-invasiv und könnte mit einer so hohen Genauigkeit eine große Hilfe beim Signalisieren sein, welche neuen Mütter von zusätzlicher Überwachung und Aufmerksamkeit profitieren könnten.
[1] De Choudhury, Munmun, Scott Grafen und Eric Horvitz. "Vorhersagen postpartaler Veränderungen in Emotion und Verhalten über soziale Medien". Tagungsband der SIGCHI-Konferenz über menschliche Faktoren in Computersystemen. ACM, 2013.