Datensatz

Die EPINetz-Plattform verbindet Daten der Social Media Plattform Twitter sowie Zeitungsartikel und macht diese durchsuch- und analysierbar. Die Integration einer weiteren Datenquelle, der Drucksachen des Bundestags, befindet sich momentan in Arbeit. Während die Twitter-Datenbank die Tweets deutscher Parlamentarier:innen, Minister:innen, Staatsvertreter:innen, Parteien und Ministerien aud EU-, Bundess- und Länderebene umfasst, besteht die News-Datenbank aus den online veröffentlichte Artikeln deutscher Zeitungen und Medienanbieter. Die gesammelten Daten werden mithilfe verschiedener Methoden analysiert und exploriert.

Twitter-Daten

Den Kern der EPINetz Twitterdaten bilden 2,806 handselektierte Twitter-Accounts, welche die deutsche institutionalisierte Politik abbilden. Für alle Abgeordneten der detuschen Landtage, des Bundestags sowie deutsche Abgeordnete des Europarlament wurde Twitter nach einem zugehörigen Account durchsucht. Ebenso wurden die Accounts der Bundes- und Landesregierungen, der Staatsekretäre sowie der Parteien und Ministerien aufgenommen. Neu gewählte und ernannte Politker:innen werden nach den Wahlen in die Liste aufgenommen. Für abgewählte Politiker:innen wird vermerkt, in welchem Zeitraum sie in ihrer jeweiligen Position tätig waren. So wird seit Projektbeginn im Jahr 2021 eine vollständige und aktuelle Liste deutscher Politiker:innen auf Twitter vorgehalten, die mit zusätzlichen Informationen wie der Parteizugehörigkeit, dem Amt, dem zugehörigen Parlament bzw. Regierung sowie der Amtszeit annotiert sind. Auch Variablen wie Alter, Geschlecht sowie die Abgeordnetenwatch und Wikidata IDs werden vorgehalten, um Verbindungen zu zusätzlichen Datenquellen herstellen zu können.

Ausgehend von dieser Liste werden alle Tweets deutscher Politiker:innen gesammelt, weiterverarbeitet und auf der EPINetz Plattform durchsuchbar gemacht. Zusätzlich werden die vollständigen ‘Conversations’, d.h. die Antworten und schriftlichen Reaktionen, aller so gesammelten Tweets erfasst. Diese Conversations dienen insbesondere der Resonanzanalyse. Zusätzlich werden innovative Verfahren erprobt, wie auf Grundlage der EPINetz Liste weitere relevante Twitter-Accounts erfasst werden können.

Die vollständige EPINetz Liste deutscher Politiker:innen auf Twitter für das Jahr 2021 steht hier zur freien Verfügung. Eine bis März 2023 aktualisierte Version finden Sie hier.

Bild: Katerina Limpitsouni

News-Daten

Bild: Katerina Limpitsouni

Die News-Daten des EPINetz-Projekts setzen sich aus den online veröffentlichen Artikeln regionaler und überregionaler deutscher Zeitungen und Medienanbieter wie der Tagesschau zusammen. Mithilfe von RSS Feeds werden werden Artikel mit ihrer Veröffentlichung in Echtzeit in die Datenbank übertragen und weiterverarbeitet. Zusätzlich werden Twitteraccounts von Medien und Politiker:innen beobachtet, um dort verlinkte Artikel ebenfalls in unsere Datenbank zu überführen. Wir verarbeiten die Artikel mitsamt Metadaten mithilfe komplexer Verfahren des Natural Language Processing (NLP) und machen sie durchsuchbar. Dies erlaubt es uns, unterschiedliche Datenquellen zu kombinieren, indem Entitäten wie Namen oder Orte sowohl in Tweets als auch Zeitungsartikeln erkannt und in Relation gesetzt werden.