Kupferstich eines Webstuhls zum Teppichweben von dem ein Faden abgeschnitten wird

Textilien: ein Webstuhl zum Teppichweben, Schneiden mit der Schere

"Kupferstich eines Webstuhls zum Teppichweben von dem ein Faden abgeschnitten wird" Public Domain Mark Autor:in: Robert Benard

Museen, Archive und vergleichbare wissenschaftsrelevante Sammlungen sehen sich vor der Herausforderung, die Nachhaltigkeit ihrer über lange Zeiträume fortlaufend kuratierten Bestandsdaten im Sinne eines „fit for purpose“ immer wieder auf den Prüfstand zu stellen. Neben internen Nutzungszwecken wie der Sammlungsverwaltung, dem Leihverkehr oder der Ausstellungsplanung sollen die Daten mittlerweile auch für neue, vielversprechende Szenarien der digitalen Nachnutzung anwendbar sein, die über die einzelne Sammlung hinausweisen. Dabei werden sie zunehmend in ihrer Eigenschaft als Forschungsdaten wahrgenommen, die gemäß den FAIR-Prinzipien aufbereitet sein sollten. Deshalb kommt es darauf an, Datenqualität im Sinne der Interoperabilität und nachhaltigen Verwendbarkeit der Datenbestände aufzufassen, was wiederum zu neuen Anforderungen an die Systeme und Arbeitsabläufe und nicht zuletzt auch an die Datenkompetenz der Mitarbeitenden führt.

Zu diesem Thema veranstaltete der NFDI4Culture-Arbeitsbereich „Standards, Datenqualität, Kuratierung“ (Task Area 2) zusammen mit dem Arbeitsbereich „Cultural Research Data Academy“ (Task Area 6) und der Fachgruppe Dokumentation des Deutschen Museumsbundes eine vierteilige offene Online-Workshopreihe für Kulturgut-Sammlungen, in deren Mittelpunkt die Sicherung und Steigerung der Qualität von Sammlungsdaten stand. Ziel der Veranstaltungen war es, Digitalmanager:innen und -kurator:innen sowie mit dem Projekt- und Prozessmanagement oder der Datenpublikation befasste Personen die verschiedenen Aspekte von Datenqualität und Strategien zur effektiven Planung, Umsetzung, Steuerung und nachgängigen Verbesserung von Datenqualität vorzustellen und sie dazu anzuregen, entsprechende Initiativen in ihren Häusern zu initiieren und zu stärken.

Das Angebot stieß auf großes Interesse: Insgesamt über 220 Interessent:innen meldeten sich an, zu jedem Workshop waren über 100 dabei. Um die Ausgangslage und die Motivation der Teilnehmer:innen besser kennenzulernen, wurde die Anmeldung von einem Fragebogen begleitet. Über einen Feedback-Fragebogen konnten sie nach der Veranstaltung jeden Workshop bewerten und weitere Bedarfe und Vorschläge äußern. Ein Etherpad wurde rege zum Austausch genutzt.

Workshop: "Datenqualität greifbar machen. Qualitätskriterien und Ziele der Datennutzung"

Der erste Workshop (16.6.2023) stellte zunächst ganz allgemein die unterschiedlichen Ausprägungen von Datenqualität vor. Nach einer Einführung von Celia Krause (Task Area 2) zu den Grundsätzen des Qualitätsmanagements, zu den Kategorien der Qualität von Daten und zu den wichtigsten Leitideen für die Sicherung von Qualität durch Standards, Leitlinien (FAIR Prinzipien), Strategien, Prozessmanagement und Operationalisierung wurde das Paradigma „Sammlungen als Daten“ (Collections as Data) aus dem anglo-amerikanischen Raum erläutert. Der anschließende Vortrag von Julia Rössel (Deutsches Dokumentationszentrum für Kunstgeschichte - Bildarchiv Foto Marburg) stellte typische Datenqualitätsprobleme vor, die das Projekt KONDA untersucht hat. Sie verwies auf Strategien, mit denen diese Probleme identifiziert, eingeordnet und analysiert werden können, um entsprechende Lösungsansätze zu entwickeln und veranschaulichte dies an einem Beispiel. Während der anschließenden Gruppenarbeiten am Online-Whiteboard wurden die Teilnehmer:innen aufgefordert, Qualitätsprobleme in ihrer Institution zu benennen, einzuordnen und Zielgruppen, Produkte und die wichtigsten Arbeitsschritte für gute Datenqualität zu erarbeiten. Ausgangsbasis waren ihre vorher priorisierten Nachnutzungsszenarien, etwa die Verbesserung der Bestandspublikation, die Nutzung durch die Forschung, Linked Open Data, die Vernetzung, die Publikation auf weiteren Plattformen und die Verbesserung der Durchsuchbarkeit der Daten.

Workshop: "Sinnvolles Management für bessere Datenqualität"

Der zweite Workshop (23.6.2023) war auf den Einsatz von Datenmanagementplänen (DMP) zugeschnitten. Diese können nicht nur für die Planung wissenschaftlicher Projekte, sondern auch auch als effektive Planungs- und Steuerungsinstrumente für die fortlaufende Sicherstellung der Qualität von Sammlungsdaten dienen. In einem einführenden Vortrag beleuchtete Celia Krause Datenqualität als Managementaufgabe auf den drei Ebenen Institution, Projekt, Daten. Dabei wurden auch die Anforderungen skizziert, denen Sammlungsdaten heute gerecht werden müssen. Sie stellte dann das Instrument des Datenmanagementplans vor, bevor Noreen Klingspor (Landesmuseum Württemberg) und Jana Hoffmann (Museum für Naturkunde Berlin) die praktische Umsetzung eines erfolgreichen Datenmanagements an ihren Einrichtungen erläuterten. Trotz ganz unterschiedlicher Vorgehensweisen ist die Sicherung definierter Datenqualitätslevels in beiden Fällen integraler Bestandteil einer digital ausgerichteten Zukunftsplanung für das gesamte Museum. Zu beiden Beiträgen gab es viele Nachfragen bezüglich der Machbarkeit und Umsetzung einer eigenen Digitalstrategie durch Methoden des Managements. Im zweiten Teil der Veranstaltung wurde die Thematik zuerst durch eine gemeinsame Übung zum besseren Verständnis von Datenmanagementplänen vertieft. Anschließend wurde in Kleingruppen ein solcher Plan anhand einer vorgegebenen Aufgabenstellung am Whiteboard entwickelt.

Workshop: "Weichenstellungen für mehr Qualität: Objektbezogene Informationen strukturieren, kontrollierte Vokabulare einsetzen"

In der dritten Veranstaltung (30.6.2023) stellte der einführende Vortrag von Angela Kailus (Task Area 2) vor, wie man durch den Entwurf eines an Communitystandards ausgerichteten Entity-Relationship-Modells die Weichen für eine nachhaltige Sammlungsdokumentation stellen kann. Dies wurde ergänzt durch Hinweise zur Strukturierung der aufzunehmenden Informationen, zum Umgang mit unsicherem Wissen und Datenprovenienz im Sinne einer guten wissenschaftlichen Praxis. In einer Mapping-Übung in mehreren Gruppen am Whiteboard übertrugen die Teilnehmer:innen reale Objektbeschreibungen aus verschiedenen Sammlungen auf das vorher vorgestellte Entity-Relationship-Modell. Nach lebhaften Diskussionen folgten im zweiten Teil weitere Vorträge: Angela Kailus gab Hinweise für die praktische Arbeit mit kontrollierten Vokabularen, das Terminologie-Mapping und den effizienten Einsatz lokaler Thesaurusmodule für die Verknüpfung mit externen Terminologien. Chiara Marchini (Deutsche Digitale Bibliothek, DDB) stellte die Pflichtelemente-Anforderungen an Datenlieferanten der DDB vor und zeigte dann, wie umfangreichere Datensätze, die dem erweiterten Kernfeldset der aktualisierten DFG-Praxisregeln „Digitalisierung“ entsprechen, in der DDB effektiver genutzt werden können und zugleich die FAIR-Prinzipien unterstützen. Eine Minimaldatensatzempfehlung für Sammlungen wird in den nächsten Monaten erarbeitet. Lukas Städing (digiCULT Verbund e. G.) verwies in seinem Beitrag auf die Vorteile, die vernetztes Arbeiten im Verbund mit sich bringt. Er stellte verschiedene Services von digiCULT vor, die den Verbundpartnern zur Verfügung stehen und die die einzelne Institution erheblich entlasten, darunter Software zur Sammlungsverwaltung, Vokabularangebote, Beratung und Datenpublikation über verschiedene Schnittstellen.

Workshop: "Nachgängige Qualitätsverbesserungen: Daten analysieren, bereinigen und anreichern"

Der vierte Workshop (7.7.2023) stand im Zeichen der nachgängigen Anpassung bereits vorhandener Datenbestände. Der einleitende Vortrag von Angela Kailus machte deutlich, wie eine unzureichende Qualität der Bestandsdaten die institutionellen Prozesse in der Sammlung und ihr Leistungsspektrum beeinträchtigen kann. Bei den Arbeitsgängen und den Erfahrungen der Nutzenden setzt die Analyse an, auf deren Grundlage Verbesserungen an den Daten geplant und priorisiert werden können. Besonders interessiert zeigten sich die Teilnehmer:innen am Beitrag von Hanna-Lena Meiners (DDK - Bildarchiv Foto Marburg, GND-Pilotagentur Bauwerke), der OpenRefine, ein leistungsfähiges und flexibles Werkzeug zur Datenbereinigung und -anreicherung, vorstellte und verschiedene Bereinigungsmethoden live präsentierte. Michaela Grein (Übersee-Museum Bremen) berichtete von den Erfahrungen ihres Museums in einem ambitionierten Projekt zur Zusammenführung und Verfügbarmachung der hauseigenen Datenbestände mit OpenRefine, das in ein kontinuierliches Datenqualitätsmanagement des Hauses überführt wurde. Dieser Beitrag stieß ebenfalls auf große Resonanz. Zuletzt berichtete Joshua Enslin (Freies Deutsches Hochstift – Frankfurter Goethe-Haus) vom aktiven Datenqualitätsmanagement der Verbundplattform museum-digital. Sie bietet ihren Partnern nicht nur gezielte Unterstützung bei der Produktion besserer Daten, sondern stärkt deren Austauschfähigkeit (u. a. Leihverkehr mit dem LIDO-Anwendungsprofil EODEM) und Nachnutzbarkeit für Forschungszwecke durch Datenanreicherung, Bereitstellung über APIs und LOD-basierte Graphennavigation.

Die Abschlussdiskussion gab den Teilnehmenden noch einmal Gelegenheit, die vorgestellten Strategien und Lösungsansätze zum aktiven Datenmanagement in Bezug auf ihre Umsetzbarkeit zu bewerten und eigene Erfahrungen zu teilen. Viele Anwesende haben in den Workshops wertvolle Impulse bekommen, die zur weiteren Auseinandersetzung mit dem Thema anregen oder dazu ermutigen, die Herausforderung Datenqualität in der eigenen Sammlung aktiv anzugehen. In den Diskussions- und Fragerunden wurde deutlich, dass manche Einrichtungen in der Umsetzung ihrer Digitalstrategie bereits weit vorangeschritten sind, während andere noch ziemlich am Anfang stehen. Es besteht eine große Bereitschaft zum Erfahrungsaustausch. Sinnvoll sind weitere Schulungs- und Vernetzungsangebote, die Sammlungen bei der erfolgreichen Umsetzung eines kontinuierlichen Datenqualitätsmanagements unterstützen. Die geäußerten Bedarfe bieten NFDI4Culture einen guten Ausgangspunkt für die Gestaltung solcher Services oder die Weitervermittlung einschlägiger Angebote Dritter.

Die Präsentationen zu den Vorträgen, Etherpads, Whiteboards der Workshops und eine Leseliste mit weiterführenden Materialien stehen hier zum Download bereit.