bibliotheks-und-archivinfor.../07_linked-data.md

11 KiB
Raw Blame History

Linked Data und Testumgebung

  • Ergebnis der Unterrichtsevaluation
  • Aktuelle Datenmodelle für Metadaten (BIBFRAME, RiC)
  • Praxisberichte
  • Metadaten anreichern mit OpenRefine und Wikidata
  • Suchanfragen mit SPARQL am Beispiel des Wikidata Query Service
  • Empfehlenswerte Tutorials zum Selbstlernen

Ergebnis der Unterrichtsevaluation

  • Gemeinsame Sichtung der (anonymen) Auswertung in Moodle
  • Ergebnis: 4,82 auf Skala 1 (--) bis 5 (++)
  • Positive Aspekte der Lehrveranstaltung aus Sicht der Studierenden
    • CodiMD als Tool für gemeinsames Dokument
    • Schaubild für Lehrinhalte
    • Prüfungsleistung Lerntagebuch
  • Negative Aspekte der Lehrveranstaltung aus Sicht der Studierenden
    • kein Zwischenfeedback für die Prüfungsleistung (Lerntagebücher)
    • allgemein in der Corona-Situation: Kombination aus Isolation und Termindruck
  • Verbesserungsmaßnahmen
    • Zwischenfeedback für die Lerntagebücher
    • Ausführliche Praxisbeispiele nicht erst in der letzten Sitzung
    • Übungen noch mehr an Anwendungsfällen aus der Praxis ausrichten

Aktuelle Datenmodelle für Metadaten

  1. BIBFRAME
  2. Records in Context (RiC)

BIBFRAME

  • seit 2012 auf Initiative der Library of Congress als Nachfolger von MARC21 (und MODS) entwickelt, aktuell ist seit 2016 BIBFRAME 2.0
  • basiert auf Functional Requirements for Bibliographic Records (FRBR) sowie Resource Description and Access (RDA) als Regelwerk, setzt diese aber nicht vollständig um
  • folgt Linked Data Paradigmen
  • besteht aus BIBFRAME Model und BIBFRAME Vocabulary
    • Datenmodell unterscheidet zwischen Work, Instance und Item
    • Datenmodell definiert Entitäten Agent, Subject und Event
    • Vokabular definiert Konzepte und deren Eigenschaften zur Beschreibung der Entitäten des Datenmodells

Links:

BIBFRAME Model

BIBFRAME Model

Quelle: https://www.loc.gov/bibframe/docs/bibframe2-model.html

BIBFRAME Vocabulary

  • Ontologie umfasst Beschreibungsklassen (Class), die jeweils über spezifische Eigenschaften (Property) verfügen
    • vergleichbar mit MARC Fields und Subfields
  • Klassen/Eigenschaften sind teilweise hierarchisch strukturiert
    • z. B. "Autor" ist Spezialfall (Subclass) eines "Beiträgers"
  • übernimmt die Konzepte von RDA
  • siehe https://id.loc.gov/ontologies/bibframe.html

Was unterscheidet MARC21 und BIBFRAME? (1/2)

As a bibliographic description format, the MARC format focuses on catalog records that are independently understandable. MARC aggregates information about the conceptual work and its physical carrier and uses strings for identifiers such as personal names, corporate name, subjects, etc. that have value outside the record itself.

Quelle: https://www.loc.gov/bibframe/faqs/#q04

Was unterscheidet MARC21 und BIBFRAME? (2/2)

Instead of bundling everything neatly as a “record” and potentially duplicating information across multiple records, the BIBFRAME Model relies heavily on relationships between resources (Work-to-Work relationships; Work-to-Instance relationships; Work-to-Agent relationships). It manages this by using controlled identifiers for things (people, places, languages, etc).

Quelle: https://www.loc.gov/bibframe/faqs/#q04

Records in Context (RiC)

  • basiert auf Linked-Data-Prinzipien
  • soll neue und mehrfache Beziehungen zwischen Entitäten ermöglichen
  • Projektgruppe ENSEMEN arbeitet an einer schweizerischen Ausprägung des neuen Standards Records in Contexts (RiC), mit Beteiligung von Niklaus Stettler (FH Graubünden)

RiC Modell

RiC Ontologie

RiC Tools

Praxisberichte (zur Auswahl)

Testumgebung für Server-Software

  • Während des Kurses besteht Zugriff auf die virtuellen Maschinen bei der FH Graubünden. Nach Ende des Kurses entfällt diese Möglichkeit.
  • Wenn Sie zukünftig einmal Server-Software testen möchten, gibt es unabhängig von der Hochschule diverse Möglichkeiten.

Vergleich Cloud vs. Lokal

  • Cloud: Root-Server (Webserver mit vollem Administrationszugriff) bei einem Webhosting-Anbieter
  • Cloud: Plattformen von Microsoft (Azure), Google (GCP), Amazon (AWS): Kosten-Rechner
  • Lokal: VirtualBox (Virtuelle Maschinen)
  • Lokal: Docker Desktop (Container)
  • Lokal: Booten von USB-Stick oder USB-Festplatte: Anleitung aus BAIN HS19

OpenRefine auf Root-Server

  • In diesem Kurs zeigen wir Ihnen die klassische Variante "Root-Server", weil dies per Videokonferenz geht und übersichtlicher ist als die Cloud-Plattformen.
  • Wir nutzen dafür den Anbieter Digitalocean, weil dieser Minutenpreise und eine einfache Benutzeroberfläche anbietet.
  • Als Anwendungsfall installieren wir OpenRefine, da wir dieses für die kommende Aufgabe gebrauchen können.

Wikidata

Suchanfragen mit SPARQL am Beispiel des Wikidata Query Service

Tutorial

Literatur

Metadaten anreichern mit OpenRefine und Wikidata

Aufgabe (30 Minuten): Wir bearbeiten gemeinsam Teile des Tutorials "Cleaning Data with OpenRefine" von John Little (2018). Die Aufgaben unten enthalten Auszüge aus Kapitel 5 Hands-on: Reconciliation.

Aufgabe 1: Neues Projekt

Aufgabe 2: Reconciliation

  • authors > Reconcile > Start reconciling…
    • Under Services, click Wikidata Reconciliation for OpenRefine (en)
    • Under Reconcile each cell to an entity of one of these types:, choose, human
    • Click, Start Reconciling
  • By clicking the approriate single checkbox in each cell of the authors column, manually select the most appropriate author for our topic. (...) Cells 2, 10 need your intervention.
    • In Cell 2, James Baldwin, select the first option which a match of “(100)”
    • In Cell 10, Click on the first name, then the second name. Do you see an African-American writer? Choose him by clicking the corresponding single check-mark

Aufgabe 3: Daten aus Wikidata ergänzen

  • authors > Edit column > Add columns from reconciled values…
    • Under Suggested Properties, click place of birth and place of death
    • OK

Literatur: Reconciliation mit OpenRefine

Empfehlenswerte Tutorials zum Selbstlernen