bibliotheks-und-archivinfor.../kapitel-7/76_verlinkung-und-anreicher...

3.1 KiB

7.6 Verlinkung und Anreicherung

Vorgehen

  • Nur Personen werden verlinkt
  • Verlinkung mit VIAF und DBpedia
  • Matching über Vorname / Nachname / Lebensdaten oder GND-Nummer
  • swissbib-Person wird angereichert mit den Informationen aus VIAF und DBpedia

Person: VIAF, DBpedia, swissbib

Person: VIAF, DBpedia, swissbib - Matching (GND-ID)

Person: VIAF, DBpedia, swissbib - Matching (Name, Lebensdaten)

Person: Anreicherung

Resultat

Verlinkung mit LIMES

LIMES ist ein Open-Source-Projekt der Uni Leipzig. Es dient der automatisierten Verknüpfung von identischen Ressourcen.

Das Ziel ist hier Übereinstimmungen zwischen den 25 Mio. swissbib-Personen und den Personen in DBPedia und VIAF herzustellen.

Technisch werden diese Übereinstimmungen über eine sameAs-Beziehung gekennzeichnet. Beispiel für ein generiertes RDF triple:

<http://data.swissbib.ch/person/8004f8a7-66e6-3880-a4fc-b2b8ae136084>
<owl:sameAs>
<http://dbpedia.org/resource/Waldo_Rudolph_Wedel>

Schritte des linking workflows bei swissbib

  • Download eines Datendumps von DBPedia / VIAF im RDF Format
  • Aufbereitung beider Datendumps (Stichwort: sortierte n-triples)
  • Transformation des kompletten swissbib Bestandes nach RDF mit Metafacture und Vorbereitung der Personentriples zum Vergleich mit Limes (auch hier im Format n-triples)
  • Suche nach owl:same Verbindungen mit limes
  • "Nachbereitung" der gefunden Verbindungen (zum Beispiel Speicherung im Triple-Store)

Datenqualität

  • Projekt zeigt was mit den vorhandenen Daten möglich ist... und was nicht
  • Matching von Personen ist schwierig, da oft nur Name und Vorname vorhanden
  • Für die Mehrheit der Personen kann kein Match erzielt werden
  • Gute Datenqualität ist Voraussetzung für Verlinkung!

Literatur