Datensatz
Twitter-Daten
Den Kern der EPINetz Twitterdaten bilden 2,806 handselektierte Twitter-Accounts, welche die deutsche institutionalisierte Politik abbilden. Für alle Abgeordneten der detuschen Landtage, des Bundestags sowie deutsche Abgeordnete des Europarlament wurde Twitter nach einem zugehörigen Account durchsucht. Ebenso wurden die Accounts der Bundes- und Landesregierungen, der Staatsekretäre sowie der Parteien und Ministerien aufgenommen. Neu gewählte und ernannte Politker:innen werden nach den Wahlen in die Liste aufgenommen. Für abgewählte Politiker:innen wird vermerkt, in welchem Zeitraum sie in ihrer jeweiligen Position tätig waren. So wird seit Projektbeginn im Jahr 2021 eine vollständige und aktuelle Liste deutscher Politiker:innen auf Twitter vorgehalten, die mit zusätzlichen Informationen wie der Parteizugehörigkeit, dem Amt, dem zugehörigen Parlament bzw. Regierung sowie der Amtszeit annotiert sind. Auch Variablen wie Alter, Geschlecht sowie die Abgeordnetenwatch und Wikidata IDs werden vorgehalten, um Verbindungen zu zusätzlichen Datenquellen herstellen zu können.
Ausgehend von dieser Liste werden alle Tweets deutscher Politiker:innen gesammelt, weiterverarbeitet und auf der EPINetz Plattform durchsuchbar gemacht. Zusätzlich werden die vollständigen ‘Conversations’, d.h. die Antworten und schriftlichen Reaktionen, aller so gesammelten Tweets erfasst. Diese Conversations dienen insbesondere der Resonanzanalyse. Zusätzlich werden innovative Verfahren erprobt, wie auf Grundlage der EPINetz Liste weitere relevante Twitter-Accounts erfasst werden können.
Die vollständige EPINetz Liste deutscher Politiker:innen auf Twitter für das Jahr 2021 steht hier zur freien Verfügung. Eine bis März 2023 aktualisierte Version finden Sie hier.
News-Daten
Die News-Daten des EPINetz-Projekts setzen sich aus den online veröffentlichen Artikeln regionaler und überregionaler deutscher Zeitungen und Medienanbieter wie der Tagesschau zusammen. Mithilfe von RSS Feeds werden werden Artikel mit ihrer Veröffentlichung in Echtzeit in die Datenbank übertragen und weiterverarbeitet. Zusätzlich werden Twitteraccounts von Medien und Politiker:innen beobachtet, um dort verlinkte Artikel ebenfalls in unsere Datenbank zu überführen. Wir verarbeiten die Artikel mitsamt Metadaten mithilfe komplexer Verfahren des Natural Language Processing (NLP) und machen sie durchsuchbar. Dies erlaubt es uns, unterschiedliche Datenquellen zu kombinieren, indem Entitäten wie Namen oder Orte sowohl in Tweets als auch Zeitungsartikeln erkannt und in Relation gesetzt werden.