Anzeige mit gelben LED-Pfeilen, die nach rechts zeigen

Yellow Arrow LED Signage

"Anzeige mit gelben LED-Pfeilen, die nach rechts zeigen" CC0 Autor:in: Isaque Pereira

Die fünfte Veranstaltung des Aufgabenbereichs Datenpublikation und Langzeitverfügbarkeit (Task Area 4) des Konsortiums für Forschungsdaten zu materiellen und immateriellen Kulturgütern fand am 17. November 2022 von 9:00 –14:30 Uhr als offenes, virtuelles Forum statt und drehte sich um das Thema "Persistent Identifiers" (PIDs). Der Fokus lag insbesondere darauf, welche Persistent Identifiers für Repositorien, Datendienste und Bildarchive der Culture Community geeignet sind und wie eine gute Praxis für die Transparenz nach außen entstehen kann.

Unter einem persistenten Identifikator wird ein permanenter und eindeutiger Verweis auf eine digitale Ressource verstanden, um sie somit auffindbar und zitierfähig zu machen. Da es verschiedene Angebote zur Referenzierung digitaler Objekte und Ressourcen gibt, stellten zunächst externe Anbieter und Initiativen, die sich auf die permanente Identifikation im Umfeld von digitalen Forschungsdaten und -ergebnissen spezialisiert haben, in Impulsvorträgen ihre Lösungen vor. Vertreter:innen aus Forschung, GLAM und Infrastruktureinrichtungen nutzten die Möglichkeit, konkrete Fragen zu stellen und sich zu Verwendung sowie Bereitstellung von PIDs in den Kultur- und Geisteswissenschaften auszutauschen.

Nach der Begrüßung durch die beiden Co-Spokespersons Dr. Maria Effinger und Dr. Jens Bove gab Robert Ulrich (KIT) eine Einführung zu Persistent Identifiers und zur Repositorien-Registry re3data. Persistente Identifikatoren spielen im gesamten Forschungsdatenzyklus eine Rolle, weshalb es eine große Auswahl an PIDs gibt. Alle stehen jedoch vor der Herausforderung, Objekte (digital oder physisch) eindeutig und nachhaltig zu referenzieren und interoperabel nutzbar zu machen. Gerade durch die Verknüpfung verschiedener Identifikatoren entfaltet sich der Mehrwert von PIDs, z.B. DOI (Digital Object Identifier) für das Werk, ORCID (Open Researcher and Contributor ID) für die Person und ROR (Research Organization Registry) für die Verknüpfung der Institution. re3data ist ein generisches Register für Forschungsdatenrepositorien, das als Gemeinschaftsprojekt einer internationalen Working Group entstand und bei DataCite angesiedelt ist. Ein internationales Redaktionsteam begleitet die Eintragungen von Repositorien in re3data und überprüft die angegebenen Metadaten sowie die Umsetzung der FAIR-Kriterien.

Im Anschluss daran präsentierte Paul Vierkant die Non-Profit-Organisation DataCite. Dabei handelt es sich um ein internationales Konsortium, das einen einfacheren Zugang zu wissenschaftlichen Forschungsdaten ermöglicht und deren Zitierfähigkeit erhöhen möchte. Der Fokus liegt dabei auf der Verwendung von DOIs, um Ressourcen (digital oder physisch) eindeutig zu referenzieren und sie in unterschiedlichen Repositorien auffindbar zu machen. Damit die Relation von Forschungsdaten zur Publikation nachvollziehbar bleibt, wird ein Metadatenschema mit teilweise kontrollierten Werten verwendet. Dieses sorgt auch dafür, dass die Forschungsdaten über Suchmaschinen auffindbar sind. Ein PID-Suchdienst ist DataCite Commons, dessen Suchergebnisse über die Verwendung von DOI, ROR und ORCID aggregiert werden.

Ein weiteres internationales Konsortium mit PID-Services für digitale Objekte ist ePIC, das von Hon.-Prof. Dr. Philipp Wieder (GWDG) vorgestellt wurde. Die angebotenen Dienste werden von großen Verbünden getragen, um die Finanzierung und Infrastruktur zu gewährleisten und um direkt auf die Anforderungen der Forschung reagieren zu können. Die sogenannte ePIC ID basiert, wie die DOI, auf einem internationalen Handle-System, das semantische Informationen enthält. Für die Publikation von Forschungsdaten kann über ein Webformular eine persistente ID erzeugt werden. Die generierten Identifier sind maschinenlesbar und können über eine REST-API abgerufen werden. Im Moment wird innerhalb der Working Group der Research Data Alliance (RDA) daran gearbeitet, Metadaten für PIDs zu standardisieren.

Eine weitere Möglichkeit, digitale Objekte permanent zitierbar zu machen, bietet der URN-Service (Uniform Resource Name) der Deutschen Nationalbibliothek (DNB), den Uta Ackermann und Stephanie Palek präsentierten. URNs für digitale Objekte sind inhaltlich geschlossene Einheiten, die langzeitarchiviert werden. Vorteil dieses Identifikators ist die Verknüpfung mit den entsprechenden Metadaten, die im Bibliothekskatalog liegen. Der gesetzlich festgelegte Sammlungsauftrag der DNB sieht vor, dass alle Werke in Text, Bild und Ton als Pflichtexemplare abgegeben werden – dazu zählen auch digitale Publikationen. Zu diesem Zwecke vergibt die DNB statische URNs, die im Nachhinein nicht mehr veränderbar sind. Partnereinrichtungen, wie Hochschulen und Verlage, können auch eigenständig URNs vergeben. Diese sind jedoch dynamisch, da sie unter gewissen Umständen veränderbar sind. In diesem Fall ist die Persistenz des Identifikators stark von der Verlässlichkeit der jeweiligen Institution abhängig. Da sich hinter den dynamischen URN mehrere URLs verbergen können, bietet die DNB einen URN-Resolver-Dienst an.

Anschließend stellte Dr. Janete Saldanha Bach (GESIS) den PID-Dienst da|ra von KonsortSWD vor. Das Konsortium ist Teil der Nationalen Forschungsdateninfrastruktur (NFDI) und entwickelt Angebote für die Forschung mit Daten aus den Sozial-, Verhaltens-, Bildungs- und Wirtschaftswissenschaften. In Zusammenarbeit mit dem ZBW betreibt GESIS die nicht-kommerzielle Registrierungsagentur da|ra, um sozialwissenschaftliche Forschungsdaten mittels DOIs permanent identifizierbar und verfügbar zu machen. Da in der Regel PIDs auf das gesamte digitale Objekt verweisen, ist es für Forschende schwierig, einzelne Teile eines Datensatzes direkt zu zitieren. Zu diesem Zwecke gibt es die Möglichkeit, variable PIDs zu registrieren, um Teilelemente und verschiedene Ebenen eines Datensatzes referenzieren zu können. Dazu wird der Service auf den Handle Standard von ePIC ausgeweitet und mit dem Metadatenstandard von DataCite versehen. Ein weiteres wichtiges Feature ist die Bulk-Verarbeitung für die Registrierung größerer Datenmengen.

Als Abschluss der Impulsvorträge stellten Dr. Melanie Gruß (Institut für Theaterwissenschaft, Universität Leipzig) und Dr. Desiree Mayer (SLUB Dresden) die Bedeutung von Normdaten in Verbindung mit PIDs vor. Normdaten sind strukturierte Datensätze, die nach einem Regelwerk angesetzt und wissenschaftlich geprüft sind. Sie besitzen eine unveränderliche ID und werden für Personen, Körperschaften, Geographika, Kongresse, Konzepte und Werke angelegt. Zu empfehlen ist die Verwendung der Normdaten, die von Nationalbibliotheken kuratiert und angeboten werden. Werden bei der Publikation von Forschungsdaten Normdaten, insbesondere Sachschlagworte, in den Metadaten verwendet, können diese verknüpft und die Forschungsarbeit nach inhaltlichen Aspekten gefunden werden.

Anschließend fand eine offene Diskussion des Plenums statt, in der einerseits Fragen zu den vorangegangenen Impulsvorträgen gestellt, aber anderseits auch Probleme und Herausforderungen bei der Verwendung von persistenten Identifikatoren thematisiert werden konnten. Angesprochene Themen waren u.a.:

  • Verwendung von mehreren PIDs bei einzelnen Objekten
  • permanente Referenzierung von Bauwerken und ihren Bestandteilen
  • Transparenz über verwendete PIDs nach außen
  • Erfahrungen zu Identifikatoren in Bezug auf Namensreferenzierung
  • Umgang mit Veränderungen in Metadaten aufgrund neuer Forschungsergebnisse
  • Verwendung von PIDs bei unterschiedlichen Datentypen

In der Forumsveranstaltung wurde deutlich, dass es je nach Bedarf bereits gut funktionierende digitale Lösungen zur dauerhaften Identifizierung, Sicherung und Auffindung von Forschungsdaten, -objekten und -ergebnissen gibt. Allerdings besteht weiterer Handlungsbedarf, um die Standardisierung sowie Verbreitung von PIDs für Forschungsdaten voranzutreiben und wissenschaftliche Forschung nach den FAIR-Kriterien möglich zu machen. Das große Interesse am Austausch zu diesem speziellen Thema war beeindruckend und wir möchten uns herzlich für die rege Teilnahme bedanken.

Das Protokoll mit ausführlichen Informationen zu den Vorträgen und der Diskussion sowie die freigegebenen Präsentationen der Impulsvorträge finden Sie hier. Die Folien zu DataCite sind bereits auf Zenodo publiziert.