Show & Tell Bericht | 18. März 2025
Workshopbericht: Vortrags- und Diskussionsreihe "Social-Media-Daten: Show & Tell - Rechtsextremismus- und Demokratieforschung (1)" (online)
Von Dr. Vincent Fröhlich
Abstract metal structure
"Low-angle photography of a metal structure" CC0 Autor:in: Alina Grubnyak
Der Arbeitskreis 'Social Media-Daten', eine Initiative von NFDI4Culture gemeinsam mit BERD@NFDI, KonsortSWD und Text+ im Rahmen der Nationalen Forschungsdateninfrastruktur, veranstaltet seit Anfang 2022 die Vortrags- und Diskussionsreihe "Show & Tell – Social Media-Daten in der Forschungspraxis".
Die Reihe widmet sich in je einer anderthalbstündigen Zoom-Session den Tools im Feld der Social Media-Forschung und beleuchtet Best Practices ausgewählter Projekte. Im Fokus stehen neben pragmatischen Lösungen und technischen Möglichkeiten (Schnittstellen, Repositorien, Metadatenstandards, Interoperabilität ...) auch ethische und rechtliche Herausforderungen (z.B. Persönlichkeits- und Urheberrechte) im nachhaltigen, sicheren und kritische Umgang mit diesen Daten (Code and Data Literacy, FAIR & CARE Prinzipien). Nicht zuletzt soll sie dazu einladen, interdisziplinäre Forschungsansätze und Lehrmethoden zu diskutieren, die tradierte wie fachspezifische Rahmen und Werkzeuge strapazieren.
2025 wollen wir uns dezidiert mit dem Umgang mit Social Media Daten in der Rechtsextremismus- und Demokratieforschung beschäftigen.
Den Auftakt am 28.02. um 14:00 Uhr machten Christian Donner vom Institut für Demokratie und Zivilgesellschaft (IDZ) und Pascal Siegers von DP-R|EX, dem Datenportal für die Rassismus und Rechtsextremismusforschung.
Christian Donner stellte zunächst das Hauptprodukt seines Projekts sowie des Vorgängerprojekts vor: Machine Against the Rage ist das Online-Magazin für digitale Konfliktforschung und liefert Datenanalyse zu Hass und Desinformation.
Sein Projekt beschäftigt sich mit dem Monitoring antidemokratischer Akteure. Dabei werden soziale Dynamiken untersucht und wie diese sich von verschiedenen Seiten hochschaukeln, was das Projekt als digitale Konfliktforschung versteht. Die untersuchte Plattform ist vor allem Telegram, es werden aber auch Daten von YouTube, TikTok und früher auch von Twitter gezogen. Donner ging zunächst ausführlich auf die Analyse von Telegram-Daten ein.
Bei Telegram beobachtet das Projekt 2000 Kanäle, von denen seit September 2022 wöchentlich Daten gezogen werden. Dabei handelt es sich um Texte, Bilder, Videos, Links, Subscriber, Views (alle 2 Wochen) und Reaktionen. Die Kategorisierung der Kanäle findet in drei größere Bereiche statt: Rechtsextremismus, Konspirationismus und Sonstige, was vor allem Prepper, russischer Imperalismus und pro-russische Propaganda ausmacht.
Die Daten wurden in einem Snowball Sampling zusammengetragen und werden nun häufiger mit dem alten Sample abgeglichen. Auswahlkriterien für das Monitoring eines Channels sind unter anderem, dass der Kanal mindestens 500 Subscriber hat, deutschsprachig ist und es sich um einen öffentlichen Channel handelt.
Das Projekt bietet zudem externe Zugangsmöglichkeiten und zahlreiche Partnerschaften an mit anderen Forschungsprojekten z. B. einem Projekt zur Querdenker-Bewegung und zivilgesellschaftlichen Organisationen, die nicht die Daten-Expertise im Haus haben. Wichtig ist dabei bei diesen Kooperationen, dass die Datensparsamkeit gewährleistet wird.
Aus den Daten hervorgehende Aussagen können Orte und Personen-Netzwerke betreffen, die Relevanz und das Wachstum der Gruppen sowie Fragen zur Aktualität und Popularität von Posts. Diese Aussagen werden im sogenannten RADAR veröffentlicht, einer Analyse metrischer Trends innerhalb des gemonitorten Samples aus den letzten 3 Monaten. Dabei werden immer wieder einzelne Themen in den Fokus gerückt wie Mobilisierung, Monetarisierung, Bilder/Memes und AI Bilder.
Als zweite Plattform stellte Donner kurz die Analyse von YouTube-Daten vor. Der Zugang läuft hier über die offizielle API und über externe APIs. Aufgenommen werden dabei Informationen zu Video-Titel, Video-Beschreibungen, Kanal-Infos, Statistiken zu Views und Likes und Transkripte (bei 1/3 der Videos). Insbesondere die Verlinkungen zwischen Telegram und YouTube schaut sich das Projekt ebenfalls an. Die Datenanalyse von TikTok-Videos befindet sich noch im Aufbau.
Pascal Siegers berichtete zunächst davon, wie sie vor einigen Jahren vom BMBF gebeten wurden im Rahmen der Bekämpfung von Rechtsextremismus, die Infrastruktur für diesen Bereich, der als Rex-Forschung abgekürzt wird, zu verbessern. Ziel sollte sein, redundate Datenerhebungen möglichst zu vermeiden, indem existierende Daten besser sichtbar gemacht werden und das Datenteilen zu fördern. Eine Pilotstudie des Projekts konnte zeigen, dass von den Daten, die in diesem Bereich in den damals letzten fünf Jahren aufgenommen wurden, 80% der Daten nicht geteilt wurden. Das Projekt soll auch die Forschung in diesem Bereich weiter fördern.
Entwickelt wurden Angebote für die Datensuche, zum Datenteilen, für die FDM Unterstützung, ein Korpus im Bereich Hate Speech und eine Datentreuhand AVERA sind im Aufbau. Herr Siegers konzentrierte sich auf die beiden letzten Angebote, den Korpus und die Datentreuhand.
Die Grundidee der Datentreuhand ist, dass es bisher redundante Aufwände für die Erstellung von Accountlisten für die akteursbasierte Datensammlung auf Social-Media-Plattformen gab. Das Datenteilen sei zwar rechtlich möglich, aber sehr aufwendig. Das Angebot sei es, eine Community-Datentreuhand zu initiieren, um so drei Probleme zu lösen: ein Vertrauensproblem (rechtliche Unsicherheit und Risiken minimieren), ein Kollektivgutproblem (Anreize schaffen) und ein Datenqualitätsproblem (Schnelligkeit als Herausforderung). Im Rahmen der Datentreuhand soll so ein Datenpool erstellt werden, der gemeinsam genutzt werden soll und der Datentreuhänder für die regelgerechte Nutzung der Daten verantwortlich ist. So werden die Vorarbeiten von DP-R|EX für die Erweiterung als Com-DTM und vermutlich auch für das Com-DS-Projekt verwendet.
Kathrin Weller aus dem GESIS-Team ergänzte hier den Vortrag zum zweiten Punkt, dem Forschungskorpus Hate Speech. Es sei noch nicht sicher, ob wirklich ein Textkorpus zur Verfügung gestellt werden könne. Einzelforscher und Forschungsgruppen aus dem Bereich könnten sich aber sehr gut an den formalen Prozessen orientieren, die hier aufgeschlüsselt würden. Fragen, auf die hier Antworten geliefert würden, seien bspw.: Wie setzt man die Architektur für Telegram-Daten-Forschung an, welche Sicherungsmaßnahmen müssen geplant werden und wie baut man eine eigene Datenerhebungs-Pipeline um?
Neben den beiden Projektvorstellungen standen sieben übergeordnete Fragen zum Umgang mit Social-Media-Daten und die Diskussion mit der Community im Vordergrund, die später auf der Knowledge Base veröffentlicht werden sollen.
Im anschließenden Gespräch mit dem Plenum wurde zudem die Sorge der Community deutlich, das Forscher:innen in dem Bereich Rechtsextremismus besonders exponiert sind, von den Universitäten und Forschungseinrichtungen aber bisher keinerlei besondere Sicherheitsmaßnahmen ergriffen werden und die Forscher:innen hier auch keine anderweitige institutionelle Rückendeckung erhalten.
Am Freitag, den 25.4.2025 um 14 Uhr wird die nächste Episode von "Social-Media-Daten: Show & Tell - Rechtsextremismus- und Demokratieforschung (2) stattfinden mit Präsentationen von Prof. Dr. Jasmin Riedl (Universität der Bundeswehr München, Projekt: SPARTA) sowie Ina Ni und Isabel Bezzaoui (FZI: Projekte DeFaktS und SOSEC – Social Sentiment in Times of Crises).
Eine Kooperation von
BERD@NFDI – NFDI Consortium for Business, Economic and Related Data
KonsortSWD – Konsortium für die Sozial-, Verhaltens-, Bildungs- und Wirtschaftswissenschaften
NFDI4Culture – Konsortium für Forschungsdaten materieller und immaterieller Kulturgüter
Text+ – Konsortium für text- und sprachbasierte Forschungsdaten
Koordination:
Vincent Fröhlich (vincent.froehlich@staff.uni-marburg.de)
Philippe Genêt (P.Genet@dnb.de)
Wenn Sie Teil der AG Social-Media-Daten in der NFDI werden möchte, abonnieren Sie gerne unsere Mailingliste.