Wie Twitter Wissenschaftlern ein Fenster in menschliches Glück und Gesundheit gibt

Seit der öffentlichen Einführung von 10 vor Jahren wurde Twitter als Plattform für soziale Netzwerke unter Freunden, als Instant Messaging-Dienst für Smartphone-Nutzer und als Werbemittel für Unternehmen und Politiker genutzt.

Aber es ist auch eine unschätzbare Quelle von Daten für Forscher und Wissenschaftler - wie ich -, die untersuchen möchten, wie sich Menschen in komplexen sozialen Systemen fühlen und funktionieren.

Durch die Analyse von Tweets konnten wir außerhalb von kontrollierten Laborexperimenten Daten über die sozialen Interaktionen von Millionen von Menschen "in freier Wildbahn" beobachten und sammeln.

Es hat uns ermöglicht, Tools für die Überwachung der kollektive Emotionen großer Populationen, Finden die glücklichste Orte in den Vereinigten Staaten und vieles mehr.

Wie also wurde Twitter zu einer einzigartigen Ressource für Computational Social Scientists? Und was hat es uns erlaubt zu entdecken?


Innerself-Abonnieren-Grafik


Twitter's größtes Geschenk an Forscher

Im Juli 15, 2006, Twittr (wie es damals hieß) öffentlich ins Leben gerufen als ein "mobiler Dienst, der Gruppen von Freunden hilft, zufällige Gedanken mit SMS herumzujagen." Die Möglichkeit, kostenlose 140-Zeichengruppentexte zu senden, hat viele Early Adopters (mich eingeschlossen) dazu gebracht, die Plattform zu nutzen.

Mit der Zeit die Anzahl der Benutzer Explosions: von 20 Millionen in 2009 zu 200 Millionen in 2012 und 310 Millionen heute. Anstatt direkt mit Freunden zu kommunizieren, würden die Benutzer ihren Followern einfach sagen, wie sie sich gefühlt haben, auf positive oder negative Nachrichten reagieren oder Witze reißen.

Für die Forscher war das größte Geschenk von Twitter die Bereitstellung großer Mengen offener Daten. Twitter war eines der ersten großen sozialen Netzwerke, das Datensamples über so genannte Application Programming Interfaces (APIs) zur Verfügung stellte, mit denen Forscher Twitter nach bestimmten Tweets (z. B. Tweets, die bestimmte Wörter enthalten) sowie Informationen zu Benutzern abfragen können .

Dies führte zu einer Explosion von Forschungsprojekten, die diese Daten nutzen. Heute produziert eine Google Scholar-Suche nach "Twitter" sechs Millionen Treffer, verglichen mit fünf Millionen für "Facebook". Der Unterschied ist besonders augenfällig, da Facebook ungefähr so ​​groß ist fünfmal so viele Nutzer wie Twitter (und ist zwei Jahre älter).

Twitter's großzügige Datenpolitik führte zweifelsohne zu einer exzellenten kostenlosen Werbung für das Unternehmen, da interessante wissenschaftliche Studien von den Mainstream-Medien aufgegriffen wurden.

Glück und Gesundheit studieren

Da herkömmliche Zensusdaten langsam und teuer zu sammeln sind, haben offene Datenfeeds wie Twitter das Potenzial, ein Echtzeitfenster bereitzustellen, um Veränderungen in großen Populationen zu erkennen.

Die Universität von Vermont Computational Story Lab wurde in 2006 gegründet und studiert Probleme in angewandter Mathematik, Soziologie und Physik. Seit 2008 hat das Story Lab Milliarden von Tweets durch den "Gardenhose" -Feed von Twitter gesammelt, eine API, die eine zufällige Stichprobe von 10-Prozent aller öffentlichen Tweets in Echtzeit streamt.

Ich verbrachte drei Jahre im Computational Story Lab und hatte das Glück, an vielen interessanten Studien mit diesen Daten teilzunehmen. Zum Beispiel haben wir eine entwickelt Hedonometer das misst das Glück der Twittersphäre in Echtzeit. Durch die Fokussierung auf Geolocated Tweets, die von Smartphones gesendet wurden, konnten wir dies tun Karte die glücklichsten Orte in den Vereinigten Staaten. Vielleicht nicht überraschend, fanden wir Hawaii ist der glücklichste Staat und Weinbau Napa die glücklichste Stadt für 2013. 

Eine Karte von 13 Millionen geolocated US Tweets von 2013, gefärbt von Glück, mit Rot, das Glück anzeigt und Blau, das Traurigkeit anzeigt. PLOS ONE, Autor zur Verfügung gestelltEine Karte von 13 Millionen geolocated US Tweets von 2013, gefärbt von Glück, mit Rot, das Glück anzeigt und Blau, das Traurigkeit anzeigt. PLoS ONE, Autor zur Verfügung gestellt.Diese Studien hatten tiefere Anwendungen: Die Korrelation der Twitter-Wortnutzung mit demografischen Merkmalen half uns, die zugrunde liegenden sozioökonomischen Muster in Städten zu verstehen. Zum Beispiel könnten wir die Wortnutzung mit Gesundheitsfaktoren wie Fettleibigkeit verknüpfen, also haben wir ein Lexicocalorimeter um den "Kaloriengehalt" von Social-Media-Posts zu messen. Tweets aus einer bestimmten Region, in denen kalorienreiche Lebensmittel erwähnt wurden, erhöhten den "Kaloriengehalt" dieser Region, während Tweets, die Bewegungsaktivitäten erwähnten, unsere Metrik verringerten. Wir haben diese einfache Maßnahme gefunden korreliert mit anderen Gesundheits- und Wellness-Metriken. Mit anderen Worten, Tweets waren in der Lage, uns zu einem bestimmten Zeitpunkt einen Überblick über den allgemeinen Gesundheitszustand einer Stadt oder Region zu geben.

Mit der Fülle von Twitter-Daten konnten wir das auch Sehen Sie die täglichen Bewegungsmuster der Menschen in beispiellosem Detail. Das Verständnis von menschlichen Mobilitätsmustern hat wiederum die Fähigkeit, Krankheitsmodelle zu transformieren und damit das neue Feld von digitale Epidemiologie.

Für andere Studien haben wir untersucht, ob Reisende auf Twitter glücklicher sind als diejenigen, die zu Hause bleiben (Antwort: sie tun) und wenn glückliche Individuen neigen dazu, in einem sozialen Netzwerk zusammen zu bleiben (wieder, sie tun es). Tatsächlich, Positivität scheint in die Sprache selbst eingebrannt zu sein, in dem Sinne, dass wir mehr positive als negative Wörter haben. Dies war nicht nur auf Twitter der Fall, sondern in einer Vielzahl verschiedener Medien (z. B. Bücher, Filme und Zeitungen) und Sprachen.

Diese Studien - und tausende anderer Menschen aus der ganzen Welt - waren nur dank Twitter möglich.

Die nächsten 10 Jahre

Was können wir von Twitter in den nächsten 10-Jahren erwarten?

Zu den aufregendsten Arbeiten gehört derzeit die Verbindung von Daten aus sozialen Medien mit mathematischen Modellen, um Phänomene auf der Bevölkerungsebene wie Krankheitsausbrüche vorherzusagen. Forscher haben bereits einige Erfolge bei der Vermehrung von Krankheitsmodellen mit Twitter-Daten erzielt, um die Influenza zu prognostizieren, insbesondere die FluOutlook Plattform von der Northeastern University und dem Institute for Scientific Interchange entwickelt.

Dennoch bleiben einige Herausforderungen bestehen. Social-Media-Daten leiden unter einem sehr niedrigen "Signal-Rausch-Verhältnis". Mit anderen Worten, die Tweets, die für eine bestimmte Studie relevant sind, werden oft durch irrelevantes "Rauschen" übertönt.

Deshalb müssen wir uns immer bewusst sein, was synchronisiert wurde. "Big-Data-Hybris"Wenn wir neue Methoden entwickeln und unsere Ergebnisse nicht überbewerten. Verbunden damit sollte das Ziel sein, aus diesen Daten interpretierbare "glass-box" Vorhersagen zu erzeugen (im Gegensatz zu "black-box" Vorhersagen, bei denen der Algorithmus versteckt oder nicht klar ist).

Social-Media-Daten werden oft (ziemlich) als kleine Kritik kritisiert, nicht repräsentative Stichprobe der breiteren Bevölkerung. Eine der größten Herausforderungen für Forscher besteht darin, herauszufinden, wie diese verzerrten Daten in statistischen Modellen berücksichtigt werden können. Während Immer mehr Menschen nutzen soziale Medien jedes JahrWir müssen weiterhin versuchen, die Verzerrungen in diesen Daten zu verstehen. Zum Beispiel neigen die Daten immer noch dazu, jüngere Individuen auf Kosten älterer Bevölkerungsgruppen zu überrepräsentieren.

Erst nach der Entwicklung besserer Bias-Korrekturmethoden werden die Forscher in der Lage sein, aus Tweets völlig sichere Vorhersagen zu treffen.

Über den Autor

Lewis Mitchell, Dozent für Angewandte Mathematik, University of Adelaide

Dieser Artikel wurde ursprünglich veröffentlicht am Das Gespräch.. Lies das Original Artikel.

Bücher zum Thema

at InnerSelf Market und Amazon