Eventide H3000 Ultra-Harmonizer, Lexicon

Eventide H3000 Ultra-Harmonizer, Lexicon

"Eventide H3000 Ultra-Harmonizer, Lexicon Alex Digital Effects Processor ×2" CC BY 2.0 Autor:in: Jeremy Keith

Terminologien sind wichtige Bindeglieder für die Vernetzung von Information, weshalb sie zum Gegenstand des NFDI4Culture-Arbeitsbereichs „Standards, Datenqualität, Kuratierung“ (Task Area 2) gehören. Die Verwendung von Terminologien in Gestalt von Online-Fachvokabularen, Normdaten-Hubs und Anwendungsontologien trägt maßgeblich zur Umsetzung der FAIR Data Principles bei: Sie fördern und erleichtern den Datenaustausch über Wissensdomänen hinweg. In digitalen Umgebungen sind sie entscheidend für die Auffindbarkeit und Interoperabilität von Forschungsdaten und erhöhen damit ihre Sichtbarkeit und Reichweite. Mit der Kategorisierung von Inhalten und Identifizierung von Entitäten in digitalen Quellen tragen sie wesentlich zur Qualität von Daten bei.

Ziel des zweitägigen Forums am 20./21.3.2024 war es, Überschneidungen im Verständnis von Terminologien, in den Bedarfen und Angeboten der Konsortien Text+, NFDI4Memory, NFDI4Objects, NFDI4Culture und Base4NFDI auszuloten und einen Überblick über Dienste, Anwendungen und Tools zu geben. Die Konsortien stellten einander ihre aktuellen Arbeitsschwerpunkten und Initiativen zum Thema Terminologien vor - ein guter Ausgangspunkt für die anschließenden Diskussionen. Insgesamt war mit 273 registrierten Teilnehmer:innen eine große Nachfrage zu verzeichnen.

Der Einführungsvortrag von Alexander Faschon (NFDI4Culture, SLUB Dresden) am ersten Tag definierte Terminologien zunächst als Begriffe, eingebettet in Begriffsordnungen, die einfach bis hierarchisch strukturiert sein können, und führte in die Möglichkeiten der Beseitigung von Mehrdeutigkeit durch terminologische Kontrolle ein. Er stellte die verschiedenen Formen kontrollierter Vokabulare und ihre Unterschiede vor, von der Wortliste über die Klassifikation, Systematik, Taxonomie, Thesaurus und Normdaten bis hin zur Ontologie.

Barbara Fichtl und Susanne Al-Eryani (beide SUB Göttingen) berichteten für Text+ über den Aufbau der GND-Agentur, die Aufgaben der Datenlieferung, Qualitätssicherung und Redaktion in der Gemeinsamen Normdatei der Deutschen Nationalbibliothek übernehmen soll. Diese soll vor allem die Ermittlung von Bedarfen, die Beratung und Aufklärung zum gewünschten Qualitätslevel der Daten sowie technische Dienstleistungen übernehmen. entityXML wurde als internes Speicher- und Austauschformat der Agentur vorgestellt, das Forschenden eine projektspezifisch akzentuierte Datenhaltung zu Normdaten-Entitäten und  eine einfache Datenlieferung an die GND bieten soll. 

Katrin Moeller (Historisches Datenzentrum Sachsen-Anhalt, Martin-Luther-Universität Halle-Wittenberg) skizzierte die Pläne von NFDI4Memory auf dem Weg zu einer eigenen GND-Agentur für die Geschichtswissenschaften. Bedarfe der Communitys wurden in einer Umfrage ermittelt: die Vermittlung von Data Literacy für die Nutzung von Vokabularen in der Wissenschaft, Umgang mit bestimmten Herausforderungen, so die Wahl geeigneter Terminologien entsprechend den fachspezifischen Anforderungen, besonders bei Geografika, Sachbegriffen und Ereignissen. So erscheint es sinnvoll, in den Quellen vorgefundene Bezeichnungen mit Beleg ins Vokabular aufnehmen zu können. Hinzu kommt die technische Einbindung von Terminologien und ein Bedarf nach unterstützenden Tools. Genutzt wird eine große Zahl von Spezialvokabularen, die in ein aufzubauendes Terminologie-Register einfließen sollen. Neben der GND als Zielsystem wird auch die Möglichkeit der Nutzung von Plattformen wie FactGrid geboten.

Für NFDI4Objects stellten Anja Gerber (Klassik Stiftung Weimar) und Frank von Hagel (Institut für Museumsforschung, SPK) die Positionen ihres Konsortiums im Umgang mit Terminologien vor. Gegenstand des Interesses ist dort v.a. die Entwicklung eines CIDOC CRM-basierten Datenmodells für Objektbiografien, das den Lebenszyklus von Objekten mit Angabe von Akteuren, Zeiten, Geografika, Ereignissen, Provenienzen und Kontexten unter Einbeziehung der Quellen und der Darstellung von unsicherem Wissen abbilden kann. Die archäologischen Wissenschaften integrieren zudem häufig naturwissenschaftliche Messdaten von Ausgrabungen und Daten aus Rekonstruktions- sowie Prospektionsverfahren. Vor allem Akteure, Orte, Sachschlagworte und Zeiträume werden durch große Referenzvokabulare abgedeckt. Es werden zusätzlich Spezialvokabulare für die Archäologie und für bestimmte Objektgattungen eingesetzt.

Die Reihe der Impulsvorträge wurde am zweiten Tag mit der Präsentation zu NFDI4Culture fortgesetzt. Angela Kailus (NFDI4Culture, DDK - Bildarchiv Foto Marburg, Philipps-Universität Marburg) stellte neben dem Culture Knowledge Graph und der NFDI4Culture Ontology zunächst die in den Communitys verwendeten Vokabulare, ihre Einsatzfelder und die wichtigsten Anwendungsszenarien vor. Für die praktische Arbeit mit Vokabularen gab der Beitrag Entscheidungshilfen bezüglich Auswahl, Nutzung und technischer Integration publizierter Terminologien. Es wurde die Integration von Vokabularplattformen und -diensten empfohlen. Thematisiert wurden auch die Veröffentlichung von eigenem Vokabular oder Möglichkeiten zur Ergänzung der großen Referenzvokabulare. In diesen Handlungsfeldern unterstützt NFDI4Culture seine Communities bereits. Weitere Schwerpunkte liegen in der Zusammenarbeit mit der GND, besonders in Bezug auf (Bau-)Werknormdaten, und in der Entwicklung von Tools zur Unterstützung von normdatenbasierter Datenannotation.

Der Beitrag von Roman Baum (ZB MED - Informationszentrum Lebenswissenschaften)  war dem in Entwicklung befindlichen Terminology Service TS4NFDI gewidmet. Als Basisdienst für alle Domänen innerhalb der NFDI bietet er die Möglichkeit einer modularen, skalierbaren und einfach konfigurierbaren Integration von Terminologien. Die Nutzenden können in externen Vokabularen suchen und Begriffe vergleichen (Bedeutungszuweisung, Synonymliste). Spätere Ausbaustufen sollen die Einbindung weiterer Terminologien, darunter auch lokaler Fachvokabulare, Mappingfunktionen und die Option zur Ergänzung neuer Begriffe umfassen. Der Dienst unterstützt die semantische Suche, die Annotation von Daten bei gleichzeitiger Benutzerfreundlichkeit. In einem Exkurs stellte Kolja Bailly (TIB Hannover) abschließend den Annotations- und Terminologiedienst ANTELOPE von NFDI4Culture vor, der für typische Nutzungsszenarien dieser Community entwickelt wird.

In den Diskussionen kristallisierten sich folgende Schwerpunktthemen heraus: 

  • Das Bestreben, GND-Daten in vielfältigen Forschungskontexten einzusetzen, ist groß. Oft wurde der Wunsch nach Zusammenarbeit mit der GND geäußert. Es zeigte sich aber Aufklärungsbedarf in Bezug auf die Möglichkeiten, eigene Forschungsdaten als Normdaten in die GND einbringen zu können, und der praktischen Umsetzung (Formulare für die Eingabe, Workflow, dauerhafte Pflege/Redaktion). Auch wünschten sich die Beteiligten Informationen zur Aufgabe und Rolle der GND-Agenturen und möglichen dauerhaften Betriebsmodellen.
  • Das grundsätzliche Problem der Auswahl des brauchbarsten Vokabulars für die eigene Zielsetzung. Die Historizität von Begriffen und die Komplexität der Fachsprache sollten abgebildet werden können, stehen aber einer Standardisierung und Vereinheitlichung entgegen. Fachvokabulare sollten deshalb einbezogen werden, wenn es darum geht, verschiedene Terminologien miteinander zu verklammern und kombinierbar zu machen. Dies ist ebenso wichtig wie eine angemessene Übertragung von Begriffen in andere Sprachen und von vertieften Informationen zur Bedeutung und Abgrenzung von Begriffen.
  • Für alle Konsortien relevant: die Veränderlichkeit von Ortsnamen in unterschiedlichen Zeitepochen und die Abbildung raumzeitlicher Zuordnungssysteme. Für Orte sollte die Angabe von differenzierten Rollen und die Kennzeichnung von Unsicherheit bezüglich der Quellenlage und Lokalisierbarkeit möglich sein. Außerdem sollten Geo-Normdaten durch die Angabe von Flächenkoordinaten (Polygone) oder von Namen in anderen Sprachen und Schriftsystemen ergänzt werden. Eine konstante Herausforderung ist die Mehrsprachigkeit und die damit einhergehende Anforderung einer möglichst präzisen Übertragung der Bedeutung von Fachbegriffen. Das Problem verschärft sich im Kontext der Dekolonisierung, wenn westlich geprägte Terminologien auf die Objekte und Bedeutungszusammenhänge nichtwestlicher Gesellschaften angewendet werden.
  • Zentrale Terminologiedienste versprechen bei spezifischen und weit gespannten Anwendungskontexten eine wesentliche Unterstützung der Einbindung von Vokabularfunktionalitäten. Um eine höhere Akzeptanz zu erzielen, sollten solche Services einfach zu implementieren und intuitiv zu bedienen sein. Konkrete Use Cases können bei der Anpassung des Angebots hilfreich sein, und ebenso Tutorials und Materialien für die Integration eigener Vokabulare. Zeitersparnis und die strategischen Mehrwerte sollten betont werden. Die Persistenz des Angebots, die Nachnutzbarkeit durch quelloffene Publikation und Verwendung dauerhaft verfügbarer externer Services (z.B. für KI-Komponenten) müssen garantiert werden.

Zusammenfassend lassen sich folgende Schnittmengen in den Interessen der beteiligten geisteswissenschaftlichen Konsortien feststellen: Zentral ist die Rolle der GND im Verhältnis zu anderen Vokabularangeboten und -initiativen. Dabei wurde auch die Frage aufgeworfen, ob die Gliederung der GND-Agenturen überdacht werden sollte, um flexibler auf die die Anforderungen der vertretenen Communitys eingehen zu können.

Auch wurde immer wieder diskutiert, was Vokabulare für die Communities konkret leisten sollen und können. Die GND deckt zwar alle Fachgebiete ab, ist für spezifische Fragestellungen der Forschung aber oft unzureichend. Daher ist es wichtig, die Rolle der Spezialvokabulare in ihrem Verhältnis zu den großen Referenzvokabularen zu bestimmen. Während Fachvokabulare für sehr spezifische Dokumentations- und Nutzungsanforderungen erstellt und erweitert werden, liegt der Wert der großen Referenzvokabulare auf der Gewährleistung fachübergreifender Interoperabilität. Differenzierte, qualitätvolle und umfassende Mappings des publizierten Fachvokabulars auf Allgemeinvokabular stellen die Brücke dar, über die auch mit Fachvokabular erschlossene Daten leichter auffindbar, interoperabel und nachnutzbar werden. Das bedeutet aber auch, dass Allgemeinvokabulare wie die GND eine ausreichende Abdeckung von  Gegenständen aufweisen müssen, um ein fachlich adäquates Mapping zu ermöglichen.  

Es wurde auch darauf hingewiesen, dass die Forschenden und die in Kulturerbe-Sammlungen tätigen Akteure mehr Unterstützung im Erwerb einschlägiger Kompetenzen benötigen, besonders in der Anwendung von existierendem LOD-Vokabular, im Aufbau, in der Pflege und Publikation von eigenem Vokabular und der Ergänzung externer Vokabulare, in der Referenzierung vorhandener Datenbestände, der Verwendung von Werkzeugen für das Management und die Integration von Terminologien. KI-Methoden versprechen Unterstützung, die Ergebnisse bedürfen aber noch der nachgängigen Absicherung durch menschliche Expertise. Die zukünftigen Potentiale sind aber durch das Training mit einschlägigen Strukturdaten zu erschließen.

Die Präsentationen zu den Vorträgen, das digitale Whiteboard, während der Veranstaltung geteilte Links und Literaturhinweise stehen HIER zum Download bereit.