„Big Data“ und eine zunehmend datengetriebene Gesellschaft sind für den Journalismus doppelt relevant: Erstens sind sie Themen, über die berichtet werden muss, um den Bürgerinnen und Bürgern die mit ihnen verbundenen Entwicklungen und Folgen verständlich zu machen und sie in die öffentliche Diskussion einzubringen. Zweitens hat „Big Data“ bereits begonnen, den Journalismus selbst zu verändern: Es entstehen neue Möglichkeiten, relevante Geschichten zu identifizieren und zu erzählen. Das Resultat ist die Entstehung eines neuen journalistischen Berichterstattungsmusters, das vielfach als „Datenjournalismus“ oder „datengetriebener Journalismus“ bezeichnet wird.
Forschungsfragen
Das Projekt reagierte auf einen blinden Fleck bei der Erforschung des Datenjournalismus. Bisher vorliegende Studien lassen sich in drei Kategorien einteilen:
- Befragungen in unterschiedlichen Ländern von am Datenjournalismus beteiligten AkteurInnen zu ihrem Selbstverständnis als JournalistInnen und ihrer Einbindung in redaktionelle Produktionsprozesse;
- Definitionen von Datenjournalismus, die meist auf kursorischen Beobachtungen des Felds fußen und sich in ihren unterschiedlichen Abgrenzungen des Phänomens und Schwerpunktsetzungen unterscheiden und z. T. widersprechen;
- inhaltsanalytische Untersuchungen datenjournalistischer Projekte, die entweder zeitlich oder geographisch stark begrenzt sind.
Was fehlte, war eine international und auf lange Sicht angelegte Inhaltsanalyse datenjournalistischer Stücke, die erfasst, wie sich dieses neue Berichterstattungsmuster entwickelt, das heißt wie sich die Liste potenzieller struktureller Elemente und Präsentationsformen, aus denen datenjournalistische Beiträge aufgebaut werden können, ihre möglichen Ausprägungen und typischen Kombinationen verändern. JournalistInnen wie ForscherInnen sind sich einig, dass sich Datenjournalismus derzeit noch in den Kinderschuhen und im fortschreitenden Wandel befindet. Zudem wird er immer wieder als die Zukunft des Journalismus ausgemacht. Dennoch wissen wir kaum etwas über seine gegenwärtige Lage und Entwicklung. Vor diesem Hintergrund verfolgte unsere Inhaltsanalyse folgende Forschungsfragen:
FF 1: Welche strukturellen Elemente und Präsentationsformen werden in datengetriebener Berichterstattung in welchen Ausprägungen kombiniert und wie entwickeln sich die Liste potenzieller Komponenten und ihre typischen Kombinationen?
FF 2: Welche Themen behandeln datenjournalistische Beiträge und wie verändert sich diese Themenauswahl?
FF 3: Welche AkteurInnen (Medienorganisationen, externe PartnerInnen usw.) produzieren Datenjournalismus und wie entwickelt sich dieses Feld über die Zeit?
Stichprobe
Die Auswahl der zu analysierenden Beiträge folgte einem induktiven und pragmatischen Vorgehen: Das Sample bestand aus den Projekten, die jedes Jahr von einer Fachjury aus JournalistInnen und ForscherInnen für den
Data Journalism Award (DJA) nominiert werden, einen Preis, den das
General Editors Network (GEN) vergibt. Anstatt also mit einer vorab festgelegten Definition, was als datenjournalistischer Beitrag zu gelten habe, zu starten und dabei möglicherweise eine zu enge oder zu breite Definition anzulegen, nutzten wir also das, was im Feld selbst als Datenjournalismus identifiziert wird. Dieser Vorteil wurde aber auch mit einem doppelten Bias der Stichprobe erkauft: Erstens ist sie selbstselektiv, da jede(r) DatenjournalistIn ihre/seine Beiträge beim DJA einreichen und die Jury diese nominieren kann oder nicht. Zweitens handelt es sich bei den Nominierten vermutlich eher nicht um den ‚alltäglichen’ Datenjournalismus, sondern um besonders aufbereitete Stücke Die Auswahl enthielt sehr wahrscheinlich vornehmlich die „extensive, thoroughly researched, investigative form of data journalism“ und weniger die „daily, quick turnaround, generally visualised, brief form of data journalism“ (Borges-Rey 2016: 9) . Gleichzeitig hatte die Stichprobe aber auch zwei besondere Vorteile: Erstens konnten auf dieser Grundlage systematische Unterschiede zwischen „nur nominierten“ und dann auch ausgezeichneten Projekten identifiziert werden. Zweitens konnte angenommen werden, dass alle analysierten Fälle als Nominierte bereits einen gewissen Qualitätsstandard erfüllen und als ‚Leuchtturm-Projekte’ oder Best-Practice-Beispiele die zukünftige Entwicklung des Datenjournalismus beeinflussen und sie somit in gewisser Weise vorwegnehmen.
Codebuch
Das Codebuch für die Inhaltsanalyse umfasste unter anderem jene Elemente, die in bisherigen Studien weitgehend einheitlich als für Datenjournalismus charakteristisch identifiziert wurden. Dazu gehören insbesondere, dass ein (meist größerer) Datensatz Grundlage des Beitrags ist, dass die Auswertungen der Daten in Diagrammen, Grafiken usw. visualisiert werden und dass der Beitrag interaktive Elemente aufweist. Die Merkmalsausprägungen der meisten Variablen wurden induktiv und auf Grundlage einer explorativen Analyse einer kleineren Stichprobe DJA-Nominierter aus dem Jahr 2013 gebildet (s. Tab. 1):
Tabelle: Dimensionen und Variablen des Codebuchs.
Dimension |
Variablen |
Autorschaft |
Medium
Medientyp
externe Partner
Anzahl beteiligter Personen |
Formale Beitragsmerkmale |
Überschrift
Thema
Bezug zu spezifischem EreignisI
Fragen, die an die Daten gestellt werden
Anzahl zugehöriger BeiträgeII
Länge des Beitrags
Sprache(n) des Beitrags
DJA-Gewinner oder nicht |
Datensatz |
Datenquelle
Art der Datenquelle
Zugang zu Daten
Art der Daten
weitergehende Informationen zu Daten angegebenI
geographischer Bezug der Daten
Veränderlichkeit der DatenIII
Zeitrahmen, der von Daten abgedeckt wird
Analyseeinheit |
Analyse und journalistische Bearbeitung |
Personalisiertes BeispielIV
Kritik oder Aufruf zu öffentlichem EingreifenII
Ziel der DatenanalyseV
Visualisierung |
Interaktivität |
Interaktive Funktionen
Online-Zugang zum DatensatzII
Möglichkeiten der Kontaktaufnahme für NutzerInnen |
I Vorgeschlagen von Datenjournalist
Lorenz Matzat
II Übernommen von Parasie und Dagiral (2013: 5–14).
III Vorgeschlagen von (Daten-)Journalismusforscher
Julian Ausserhofer.
IV Inspiriert von Holtermann (2011).
V Inspiriert von Gray et al. (2012).
Quellen
Borges-Rey, Eddy (2016): Unravelling data journalism. A study of data journalism practice in British newsrooms. In: Journalism Practice (online first). Online verfügbar unter: http://dx.doi.org/10.1080/17512786.2016.1159921.
Gray, Jonathan; Bounegru, Liliana; Chambers, Lucy (Hg.) (2012): The data journalism handbook. How journalists can use data to improve the news. (Early release). Sebastopol: O’Reilly. Online verfügbar unter: http://datajournalismhandbook.org/.
Holtermann, Hannes (2011): Datenjournalismus: eine neue Form der journalistischen Wertschöpfung aus Daten. Unveröff. Masterarbeit. Hamburg.
Lombard, Matthew; Snyder-Duch, Jennifer; Bracken, Cheryl Campanella (2002): Content analysis in mass communication. Assessment and reporting of intercoder reliability. In: Human Communication Research, Jg. 28, Nr. 4, S. 587–604. Online verfügbar unter: http://dx.doi.org/10.1111/j.1468-2958.2002.tb00826.x.
Parasie, Sylvain; Dagiral, Eric (2013): Data-driven journalism and the public good. “Computer-assisted-reporters” and “programmer-journalists” in Chicago. In: New Media & Society, Jg. 15, Nr. 6, S. 853–871. Online verfügbar unter: http://dx.doi.org/10.1177/1461444812463345.
Weitere Informationen
Eine detailliertere Beschreibung der Methode, ein kurzer Überblick über den Forschungsstand zum Datenjournalismus sowie eine Analyse der Daten von 2013 bis 2015 findet sich in einem Arbeitspapier des Hans-Bredow-Instituts, das
hier zum Download steht.