Nachricht | 24. März 2023

Integration von Forschungsdaten aus dem Corpus Vitrearum Deutschland in den Culture Knowledge Graph

Schlagworte
Nachricht
Gehäusearchitektur mit zwei Engeln, Corpus Vitrearum Deutschland

Gehäusearchitektur mit zwei Engeln, zwei Jünglingen, Gottvater und Engel

CC BY-NC 4.0 Autor:in: Ulrich Engert

Ein Beitrag von Jonatan Jalle Steller

Ein wenig zusätzliches Markup auf der Webseite des Corpus Vitrearum Deutschland reichte aus, um die Daten in den NFDI4Culture Knowledge Graph aufzunehmen und die Inhalte gleichzeitig besser auffindbar zu machen. Denn das Markup ist so aufgebaut, dass es Inhalte verschiedener Projekte nicht nur nach Orten, Epochen, und Motiven verknüpfbar macht, sondern auch deren Maschinenlesbarkeit verbessert. Mit wenigen zusätzlichen Zeilen Code wurden die Inhalte auch in die Google Dataset Search und mehrere gebräuchliche Bildersuchen aufgenommen.

Der zusätzliche Code, der für die Integration in den Knowledge Graph benötigt wird, kann entweder direkt ins Template einer Webseite geschrieben oder alternativ z.B. durch Plugins ergänzt werden, die schema.org-Markup beherrschen. So wie viele andere Webseiten, die auf Content-Management-Systemen wie TYPO3, WordPress, Drupal oder MediaWiki fußen, nutzt das Corpus Vitrearum eine flexible Templating Engine. Wir entschieden uns dazu, den Code direkt in unserem Bildarchiv einzubetten, da hier alle Daten abrufbar sind, die in den Knowledge Graph aufgenommen werden sollten. Zur Umsetzung des Grundbeispiels in der Dokumentation des Culture Graph Interchange Formats (CGIF) musste nur ein einziges benötigtes Feld mit etwas zusätzlichem Code bereitgestellt werden: das Datum, wann die Datensammlung zuletzt aktualisiert wurde. Bei allen anderen Feldern reichte es aus, die richtigen Template-Tags in den Beispielcode einzusetzen.

Beim Knowledge Graph geht es nicht darum, alle Daten aufzunehmen, die die teilnehmenden Projekte zur Verfügung stellen könnten, sondern eine begrenzte aber vergleichsweise universelle Auswahl zu nutzen, die sich für das Verknüpfen von Inhalten über Projekte hinweg eignet. Neben der URL einer Ressource ist dies ihre grobe Gattung (Bild, Audio, Video), ihr Name, ihre geschichtliche Epoche sowie Stichworte aus verbreiteten kontrollierten Vokabularen, wodurch beispielsweise Orte, zugehörige Personen und Motive abgedeckt werden können. Durch die Integration unserer Forschungsdaten in den Culture Knowledge Graph können wir nun alle Abfragemöglichkeiten (SPARQL) nutzen, um relevante Inhalte anderer Forschungsprojekte in unserem Webangebot sichtbar machen zu können.

Dies ist besonders wichtig für ein Projekt, das sich der Bewahrung von Abbildungen und Wissen zu mittelalterlichen und frühneuzeitlichen Glasmalereien in Deutschland verschrieben hat: Denn man muss davon ausgehen, dass sich Nutzende kontextuelle Informationen außerhalb des Projektrahmens erschließen können möchten, wie z.B. die Darstellung eines Motivs über Gattungsgrenzen hinweg in derselben historischen Periode oder auch im Vergleich zu anderen internationalen Glasmalereitraditionen. Diese Inhalte anzubieten ist aber nahezu unmöglich ohne auf eine kuratierte und vertrauenswürdige Verknüpfung wie den Content Graph zurückzugreifen.

Während des Bereitstellens von Daten für NFDI4Culture konnte wir unsere Website durch die Verwendung des Culture Graph Interchange Formats auch im Bereich der Search Engine Optimisation (SEO) deutlich verbessern. Da mehrere Suchmaschinen dasselbe schema.org-Markup erwarten, aus dem auch das CGIF besteht, habe wir eine Zahl optionaler Felder ergänzt und dokumentiert, durch die Ressourcen auch in andere Knowledge Graphs wie den von Google aufgenommen werden können. Im Ergebnis ist die Projektwebseite nun nicht nur in der akademisch ausgerichteten Dataset Search gelistet. Die einzelnen Bilder sind darüber hinaus auch in der Bildersuche dieses kommerziellen Anbieters gelistet, wodurch Profis wie Amateure die qualitativ hochwertigen Fotografien des Projekts nun besser auffinden können.

Unsere Zusammenarbeit mit den NFDI4Culture Teams "Knowledge Graph" und "Portal" haben wir auch auf der DHd2023 Konferenz vorgestellt. Die Folien der Präsentation mit relevanten Links, Illustrationen und SPARQL-Beispielabfragen finden sich auf Zenodo:

https://zenodo.org/record/7748740 (Knowledge Graph basierte Forschugndatenintegration in NFDI4Culture)