Element 68Element 45Element 44Element 63Element 64Element 43Element 41Element 46Element 47Element 69Element 76Element 62Element 61Element 81Element 82Element 50Element 52Element 79Element 79Element 7Element 8Element 73Element 74Element 17Element 16Element 75Element 13Element 12Element 14Element 15Element 31Element 32Element 59Element 58Element 71Element 70Element 88Element 88Element 56Element 57Element 54Element 55Element 18Element 20Element 23Element 65Element 21Element 22iconsiconsElement 83iconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsiconsElement 84iconsiconsElement 36Element 35Element 1Element 27Element 28Element 30Element 29Element 24Element 25Element 2Element 1Element 66

MEDIA RESEARCH BLOG

Blog Header Background Image
Zur Übersicht
Twitter-Daten zum Ukrainekrieg

Twitter-Daten zum Ukrainekrieg

04.04.2022

Ein Forscher*innen-Team des HBI sammelt seit Beginn des Krieges Tweets zur Ukraine in einer öffentlich zugänglichen Datenbank. Was man aus diesen Daten lesen kann und inwiefern sie für zukünftige Forschung wichtig sein könnten, erklärt Dr. Felix Münch.
 
Ihr sammelt Tweets zum Ukrainekrieg. Als Medienforscher*innen, was war eure Motivation?
Die Kommunikationsforschung interessiert sich schon seit über einem halben Jahrhundert dafür, wie sich Informationen und Meinungen nach einschneidenden Ereignissen verbreiten. Früher war man allerdings auf Umfragen und Fragebögen angewiesen – nach dem Tod von J. F. Kennedy oder Marilyn Monroe etwa oder nach den Anschlägen auf das World Trade Center in New York am 11. September. Online-Medien und digitale Spuren bieten der Wissenschaft nun ganz neue Möglichkeiten der Datenerhebung.
 
Tweets zum Schlagwort „Ukraine“ zu sammeln, ist also der pragmatische Versuch, im großen Umfang digitale Spuren für Putins Krieg gegen die Ukraine zu sammeln.
 
Reicht es, nach nur einem Schlagwort zu suchen? Gibt es nicht viel mehr Tweets zum Thema?
Dass wir, Philipp Kessling und ich, nur ein einzelnes Schlagwort sammeln, ist der Einschränkungen der von Twitter für Wissenschaftler*innen bereitgestellten Schnittstellen geschuldet. Hätten wir z. B. auf Englisch nicht nur den Hashtag gesammelt, sondern das Wort „Ukraine“ (ohne #), so wären wir schnell über die uns von Twitter zugestandenen Limits von abfragbaren Datenmengen gekommen. So ist das auch in anderen Datensammlungen, die mir bekannt sind, gelaufen. Die haben jetzt zwar Tweets zu mehr Begriffen, aber auch eine unbekannte Dunkelziffer. Uns war es wichtiger, einen kompletten Datensatz zu haben, bei dem wir wissen, was wir nicht wissen. Nach der zweiten Kriegswoche hatten wir alleine mit unseren sehr eingeschränkten Schlagwortsuchen bereits über 25 Millionen Tweets in den vier Sprachen Englisch, Deutsch, Russisch und Ukrainisch gesammelt.
 
Wie habt ihr das gemacht?
Im Rahmen unseres Projekts Social Media Oberservatory (SMO), das Teil des Forschungsinstituts Gesellschaftlicher Zusammenhalt (FGZ), ist, haben wir in den letzten zwei Jahren die Strukturen aufgebaut, um schnell und flexibel auf derartige Ereignisse reagieren zu können: eine zuverlässige Cloud-Infrastruktur, die nach Bedarf hochgefahren werden kann, entsprechendes Know-how, ein Team, das dieses Know-how anwenden kann, sowie Zugänge zu den entsprechenden Schnittstellen von Social-Media-Plattformen für die Datenabfrage.
 
Das ermöglicht uns jetzt, auch im Rahmen des kürzlich gestarteten NOTORIOUS Projekts, schnell auf für die Social-Media- und Desinformations-Forschung interessante Ereignisse zu reagieren.
 
Twitter gewährt der Forschung ja seit geraumer Zeit einen erweiterten Zugang zu Daten, die Nutzer*innen öffentlich geteilt haben. Das besondere an diesen akademischen Zugängen im Gegensatz zu den frei verfügbaren ist, dass wir auch Abfragen zu Tweets machen können, die älter als eine Woche sind. Theoretisch können wir rückwirkende Abfragen bis zum 1. Tag der Existenz Twitters machen.
 
Wann habt ihr mit dem Sammeln begonnen?
Wir haben kurz nach Beginn der Invasion angefangen, aktiv zu sammeln. Da wir auch Fragen zu etwaigen Aktivitäten im Vorfeld beantworten können wollen, haben wir rückwirkend Tweets ab 1. Februar 2022 abgefragt. Für jene ohne akademischen Zugang zu Twitter-Daten sind dies besonders interessante Daten.
 
Gleichzeitig haben wir regelmäßige Abfragen für aktuelle Tweets gestartet, um neue Tweets der Datensammlung hinzuzufügen. Diese „Live“-Abfrage ist wichtig, da gerade in diesem Fall viele der Daten erwartbarerweise ein „Mindesthaltbarkeitsdatum“ haben. Werden Tweets oder Accounts gelöscht oder anderweitig depubliziert, sind sie auch für uns nicht mehr verfügbar. So zum Beispiel vor zwei Wochen geschehen bei einem Twitter-Account des russischen Verteidigungsministeriums, das seinen Account auf „geschützt“ gestellt hatte.
 
Dadurch, dass wir die veröffentlichten Tweet IDs täglich aktualisieren (mit mindestens 12-36 Stunden Zeitversatz, sodass sie für die militärische Nutzung, etwa die Nutzung von Standortdaten (https://www.sueddeutsche.de/politik/ukraine-krieg-deutsche-autobahnen-miltaertransporte-verkehrskameras-1.5547662) oder koordinierte Desinformation, weniger brauchbar sind), können auch andere Teams versuchen, noch möglichst vollständige Daten zu bekommen.
 
Wie kann man sich den Datensatz vorstellen? Woraus besteht der?
Wir sammeln die Tweet-IDs. Also im Prinzip das Ende einer URL zu einem Tweet. https://twitter.com/user/status/1502309154358239233 führt etwa zu meinem Tweet über das Datenset. Aber die Tweets lassen sich noch schneller und im Bulk über frei verfügbare Schnittstellen abrufen, dass nennt sich dann im Twitter-Jargon „rehydrieren“.
 
Die Tweet-IDs erlauben anderen, z. B. Datenjournalist*innen, schnell die Tweetinhalte, auch von vor über einer Woche, abzurufen.
 
Für wen ist der Datensatz interessant?
Der Datensatz ermöglicht erstmal so gut wie jedem, die Tweetinhalte schnell und gezielt abzurufen. Diese können dann einer Vielzahl von Analysen zugeführt werden: Netzwerkanalysen, Inhaltsanalysen, automatisiert, quantitativ, qualitativ, sie sind eigentlich zu nutzen für alles, was man mit Text, Netzwerk- und Zeitreihendaten so machen kann.
 
Ich glaube und hoffe, dass es vor allem Kommunikationswissenschaftler*innen, Forscher*innen aus den Computational Social Sciences, Datenwissenschaftler*innen und Datenjournalist*innen helfen wird. Das Ziel ist die Ermöglichung einer so breit angelegten und so schnellen Analyse dieser Kommunikation wie möglich, eines „level playing fields“, zumindest auf dem Feld der Twitter-Analyse. Deswegen veröffentlichen wir die Daten auch schon, bevor wir selbst irgendetwas damit gemacht haben. Wenn nicht in diesem Fall Open Science, wann dann?
 
Was kann man jetzt schon aus den Daten lesen?
Bisher sichtbar ist, dass sich bereits vor dem Einmarsch von Putins Truppen die Aktivität auf Twitter in den untersuchten Sprachen ab Mitte Februar leicht erhöht hat. Dann springt sie schlagartig am 24. und 25. Februar innerhalb von 24 Stunden von wenigen 10.000 Tweets pro Tag auf mehrere Millionen. Das flacht dann innerhalb einer Woche wieder auf unter eine Million Tweets pro Tag ab und liegt mittlerweile im unteren hunderttausender Bereich. Das liegt, neben dem Abflachen der Aufmerksamkeit und Erregung der Öffentlichkeiten nach dem ersten Schock, allerdings wohl auch daran, dass der Diskurs differenzierter geworden ist und sich oft nicht mehr um die Ukraine als Ganzes, sondern um einzelne Personen, Städte und Ereignisse dreht.
 
Des Weiteren kann man sehen, dass der Diskurs auf Englisch erwartbar der aktivste ist. Überrascht hat mich allerdings, dass selbst der deutschsprachige Diskurs zahlenmäßig noch den auf Russisch oder Ukrainisch um ein Vielfaches übersteigt. Das verdeutlicht, dass in Russland Twitter, schon vor seiner Sperrung dort, einfach kein wichtiges Medium darstellt, sondern, wenn man dort Menschen erreichen will, die Kommunikation auf anderen Kanälen wichtiger ist. Deshalb war es z. B. eine weise Entscheidung von Arnold Schwarzenegger, und wohl auch seinem Team, seine Videonachricht an seine russischen Fans auch auf Telegram und YouTube zu verbreiten.
   
Bei Beantwortung welcher Forschungsfragen könnten diese Daten außerdem in Zukunft nützlich sein?
Bei einem so großen Datensatz gibt es mehr Fragen, als man beantworten kann. Uns interessiert gerade vor allem, welche Themen in welcher Phase dieses Ereignisses dominant waren, wie wir verschiedene Interessensgruppen auseinanderhalten können und welche es gibt, ob sich vielleicht schon vor Beginn des Einmarsches Zeichen einer Eskalation finden lassen und wie sich zeitlich einzuschränkende Ereignisse in den Daten zu beobachten sind, etwa die Sperrung von Twitter in Russland oder auch die Wirtschaftssanktionen.
 
Ich wurde in den letzten Tagen z. B. oft gefragt, ob wir die immer wieder anekdotisch aufgekommene Theorie be- oder widerlegen können, dass nach den Wirtschaftssanktionen bezahlte „Trolle“ inaktiver geworden seien, weil sie keine Zahlungen mehr erhalten können. Ehrlich gesagt, bezweifle ich gerade, dass wir das zeigen oder widerlegen können, aber wir werden es versuchen.
 
Habt ihr ähnliche Sammlungen schon bei anderen aktuellen „Ereignissen“ angelegt?
Zur Bundestagswahl 2021 haben wir alle Tweets der Bundestagswahlkandidierenden sowie Bundestagsabgeordneten rund um die Wahl herum gesammelt. Am Digital Media Research Centre der Queensland University of Technology war ich außerdem an einem Projekt meines Doktorvaters Axel Bruns beteiligt, das einen Großteil aller von australischen Twitter-Accounts geposteten Tweets gesammelt hat. Das war für mich eine kommunikationswissenschaftliche Goldgrube und hat mich auch inspiriert, große Datensammlungen selbst ermöglichen zu wollen.
 
Warum ist es in euren Augen wichtig, diese Daten zu sammeln?
Als ich mich entschieden habe, die Daten zu sammeln und zu veröffentlichen, hatte ich den Slogan der Washington Post im Kopf: „Democracy Dies in Darkness“. Da ich selbst auch eine Journalistenausbildung genossen habe, geht mir dieser Satz nahe. Vielleicht auch, weil ein Journalist, Marvin Milatz vom NDR, durch seine Anfrage, ob wir irgendwas zur Ukraine sammeln, den Ball in meinem Kopf erst richtig ins Rollen gebracht hat.
 
In diesem Sinne glaube und hoffe ich, dass Transparenz auf so einem offenen Medium wie Twitter der demokratischen, wahrheitssuchenden Mehrheit hilft und den Desinformanten und Propagandisten schadet. Ich hoffe, dass die Daten vor allem auf dem Feld der Desinformationsforschung helfen werden, Wahrheitsverdrehern und Lügnern das Leben in einem Internet der Meinungsfreiheit und des freien Journalismus schwerer zu machen.
 
Wie lange wollt ihr noch Daten sammeln?
Ich hoffe, dass wir morgen damit aufhören können, weil Putin seine Truppen abzieht. Ansonsten machen wir so lange weiter, wie wir können.

Link zum Datensatz: https://github.com/Leibniz-HBI/ukraine_data
 
Die Fragen stellte Johanna Sebauer

Photo by Tina Hartung on Unsplash

Weitere Artikel

mehr anzeigen

Newsletter

Infos über aktuelle Projekte, Veranstaltungen und Publikationen des Instituts.

NEWSLETTER ABONNIEREN!