Kapitel 2 (05.12.) ergänzt

This commit is contained in:
Felix Lohmeier 2017-10-12 15:58:44 +02:00
parent f2f401267a
commit 19beaacc9b
15 changed files with 236 additions and 0 deletions

View File

@ -31,6 +31,12 @@ Kapitel 1: Einführung ins Thema, Installation der Arbeitsumgebung und eine Wied
Kapitel 2: Bibliotheks- und Archivsysteme \(05.10.2017\)
* [2.1 Metadatenflüsse der ETH-Bibliothek](/kapitel-2/21_metadatenflusse-der-eth-bibliothek.md)
* [2.2 Datenstruktur von Archivsystemen](/kapitel-2/22_datenstruktur-von-archivsystemen.md)
* [2.3 Online-Präsentation von Digitalisaten](/kapitel-2/23_online-praesentation-von-digitalisaten.md)
* [2.4 Discovery-System Wissensportal](/kapitel-2/24_discovery-system-wissensportal.md)
* [2.5 Datenbereitstellung für externe Portale](/kapitel-2/25_datenbereitstellung-fur-externe-portale.md)
Kapitel 3: Übertragungsprotokolle und Crosswalks \(02.11.2017\)
Kapitel 4: Suchmaschinen, Modellierung für Meta-Suche \(16.11.2017\)

View File

@ -9,6 +9,11 @@
* [1.5 Übung: Metadaten über eine SRU-Schnittstelle laden](kapitel-1/15-ubung-metadaten-uber-eine-sru-schnittstelle-laden.md)
* [1.6 Metadaten ansehen mit OpenRefine](kapitel-1/16-metadaten-ansehen-mit-openrefine.md)
* [Kapitel 2](kapitel-2.md)
* [2.1 Metadatenflüsse der ETH-Bibliothek](/kapitel-2/21_metadatenflusse-der-eth-bibliothek.md)
* [2.2 Datenstruktur von Archivsystemen](/kapitel-2/22_datenstruktur-von-archivsystemen.md)
* [2.3 Online-Präsentation von Digitalisaten](/kapitel-2/23_online-praesentation-von-digitalisaten.md)
* [2.4 Discovery-System Wissensportal](/kapitel-2/24_discovery-system-wissensportal.md)
* [2.5 Datenbereitstellung für externe Portale](/kapitel-2/25_datenbereitstellung-fur-externe-portale.md)
* [Kapitel 3](kapitel-3.md)
* [Kapitel 4](kapitel-4.md)
* [Kapitel 5](kapitel-5.md)

Binary file not shown.

After

Width:  |  Height:  |  Size: 601 KiB

BIN
images/e-manuscripta.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 1.2 MiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 127 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 281 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 672 KiB

BIN
images/oai-pmh-beispiel.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 138 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 435 KiB

View File

@ -1,4 +1,15 @@
# Kapitel 2: Bibliotheks- und Archivsysteme \(05.10.2017\)
Die Sitzung am 5. Oktober haben Sven Koesling und Michael Gasser von der ETH Zürich gestaltet. Sven Koesling leitet den Bereich IT-Services an der ETH-Bibliothek und Michael Gasser leitet den Bereich Archive an der ETH-Bibliothek. Sie haben einen ausführlichen Praxiseinblick in die an der ETH-Bibliothek verwendeten Bibliotheks- und Archivsysteme gegeben. Hier im Skript werden diejenigen Kernpunkte dokumentiert, die für das weitere Verständnis des Kursus von besonderer Bedeutung sind.
Bitte nehmen Sie sich für die folgenden Abschnitte insgesamt etwa 4 Stunden Zeit:
* [2.1 Metadatenflüsse der ETH-Bibliothek](/kapitel-2/21_metadatenflusse-der-eth-bibliothek.md)
* [2.2 Datenstruktur von Archivsystemen](/kapitel-2/22_datenstruktur-von-archivsystemen.md)
* [2.3 Online-Präsentation von Digitalisaten](/kapitel-2/23_online-praesentation-von-digitalisaten.md)
* [2.4 Discovery-System Wissensportal](/kapitel-2/24_discovery-system-wissensportal.md)
* [2.5 Datenbereitstellung für externe Portale](/kapitel-2/25_datenbereitstellung-fur-externe-portale.md)
Beiträge in den Lerntagebüchern der Studierenden:
* ...

View File

@ -0,0 +1,27 @@
# 2.1 Metadatenflüsse der ETH-Bibliothek
Mit zunehmenden Anforderungen an die Verwaltung und Präsentation von Bibliotheks- und Archivressourcen wurden im Laufe der Zeit zahlreiche neue Systeme an der [ETH-Bibliothek](https://www.library.ethz.ch) eingeführt. Es war nicht mehr möglich alle Ressourcen ausschließlich im integrierten Bibliothekssystem bzw. im Archivinformationssystem zu verwalten. Heute gibt es eine Trennung unter anderem zwischen Metadatenhaltung (getrennt für Bibliotheks- und Archivressourcen), Discovery, Online-Präsentation und digitaler Langzeitarchivierung.
## Produkte an der ETH-Bibliothek
Folgende zentrale Produkte werden derzeit an der ETH-Bibliothek eingesetzt:
* Integriertes Bibliothekssystem: [Aleph](http://www.exlibrisgroup.com/de/category/ExLibrisAleph)
* Archivinformationssystem): [CMISTAR](https://www.cmiag.ch/cmistar)
* Discovery-System: [Primo](http://www.exlibrisgroup.com/de/category/Primo)
* Online-Präsentation von Digitalisaten: [Visual Library](https://www.semantics.de/visual_library/)
* Digitale Langzeitarchivierung: [Rosetta](http://www.exlibrisgroup.com/de/category/Rosetta)
## Datenfluss von Quellsystemen ins "Wissensportal"
Die Metadaten der ETH-Bibliothek werden in mehreren Quellsystemen verwaltet. Um eine übergreifende Suche für die Nutzer zu ermöglichen, werden alle Ressourcen im Discovery-System Primo (an der ETH "[Wissensportal](http://www.library.ethz.ch/de/)" genannt) zusammengeführt.
Das erfordert eine Transformation der Daten in einheitliches Format. Dieser Prozess der Vereinheitlichung wird auch "Normalisierung" genannt.
## Metadatenflussdiagramm der ETH Bibliothek (Stand: 1.9.2016)
Das folgende Diagramm visualisiert die Datenflüsse zwischen den Systemen.
![Metadatenflussdiagramm](../images/metadatenfluss-eth-bibliothek-2016-09.png)
Quelle: Judith Bisseger & Barbara Wittwer (1.9.2016): Metadatenmanagement. Die ETH-Bibliothek beschreitet neue Wege. Präsentation auf dem BIS-Kongress 2016 in Luzern. <https://www.slideshare.net/ETH-Bibliothek/metadatenmanagement-die-ethbibliothek-beschreitet-neue-wege>

View File

@ -0,0 +1,61 @@
# 2.2 Datenstruktur von Archivsystemen
Als digitale Archivsysteme entwickelt wurden, orientierte sich die Datenstruktur an analogen Findmitteln wie Findbüchern und Zettelkästen. Diese sind oft strukturiert nach Sachbetreffen (Pertinenzprinzip) und so sind auch bis heute die Metadaten in Archivsystemen strukturiert.
## Verzeichnungsstandard ISAD(G)
Ein wichtiger Verzeichnungsstandard im Archivwesen wurde 1994 (Revision 2000) eingeführt, die "International Standard Archival Description (General)" - kurz [ISAD(G)](https://de.wikipedia.org/wiki/ISAD(G)). Grundsätzlich gibt es hier eine mehrstufige Verzeichnung im Provenienzprinzip, um den Entstehungszusammenhang abzubilden.
Der Standard enthält 26 Verzeichnungselemente in 7 Informationsbereichen:
1. Identifikation
2. Kontext
3. Inhalt und innere Ordnung
4. Zugangs- und Benutzungsbedingungen
5. Sachverwandte Unterlagen
6. Anmerkungen
7. Kontrolle
Von besonderer Bedeutung sind 6 Pflichtfelder:
* Signatur
* Titel
* Provenienz
* Entstehungszeitraum
* Umfang
* Verzeichnungsstufe
Grenzen von ISAD(G):
1. Ein einzelner Datensatz ist unter Umständen nur im Kontext verständlich (z. B. nur "Protokoll" als Titel)
2. Die Tektonik ist eindimensional (keine Mehrfachzuordnung möglich)
3. Der Standard enthält keine Vorgaben zur Digitalisierung oder zur digitalen Langzeitarchivierung
Um Normdateien verzeichnen zu können, wurde später ein ergänzender Standard "International Standard Archival Authority Record for Corporate Bodies, Persons, and Families" - kurz [ISAAR(CPF)](https://de.wikipedia.org/wiki/ISAAR(CPF)) verabschiedet. Dieser wird in der Praxis wegen dem Zusatzaufwand bei der Erschließung jedoch nur selten verwendet. Die ETH-Bibliothek führt Register für Personen, Körperschaften, Orte und Sachen auch im Archivbereich nach bibliothekarischen Regeln, d.h. mit Rollenkennzeichnung nach RDA und Verzeichnung von GND-IDs.
Aktuell ist ein neuer Standard "Records in Contexts" ([RIC](https://de.wikipedia.org/wiki/Records_in_Contexts)) in Entwicklung. Dieser zielt auf eine Weiterentwicklung in Richtung Linked Data und soll neue und mehrfache Beziehungen zwischen Entitäten ermöglichen. Bis dieser neue Standard in Archivsystemen verwendet wird, werden jedoch voraussichtlich noch einige Jahre vergehen.
## Archivinformationssysteme
Der Markt in der Schweiz wird von den Produkten [scope.Archiv](http://www.scope.ch) und [CMISTAR](https://www.cmiag.ch/cmistar) dominiert. An der ETH-Bibliothek wird das Produkt CMISTAR eingesetzt. Es ist Grundlage des [Hochschularchivs der ETH Zürich](http://www.library.ethz.ch/Ressourcen/Archivalien-Dokumentationen/Hochschularchiv-der-ETH-Zuerich), des [Thomas-Mann-Archivs](http://www.tma.ethz.ch/) und des [Max Frisch-Archivs](http://www.mfa.ethz.ch/). Als Datenmodell kommt der genannte ISAD(G)-Standard zum Einsatz.
Das System bietet Möglichkeiten zum Import von Daten (z.B. bei Retroerfassung auf Basis von Excel) sowie einen parametrisierbaren Datenexport über ein Publikationsmodul, das XML-Dateien generiert. Dieser Datenexport wird in das "Wissensportal" der ETH-Bibliothek eingespielt.
Hier ein Beispiel aus dem Hochschularchiv der ETH Zürich, aus der die Verzeichnungsstruktur ersichtlich ist:
![](../images/eth-archivdatenbank-beispiel.png)
## Übung: Ein Vergleich aus Nutzersicht
Suche nach:
1. «Einstein» im [Online Archivkatalog des Staatsarchivs BS](https://query.staatsarchiv.bs.ch/query/suchinfo.aspx)
2. «Einstein Ehrat» in der [Archivdatenbank Online, Hochschularchiv ETH Zürich](http://archivdatenbank-online.ethz.ch)
Beantworten Sie für sich die folgenden Fragen:
* Welche Informationen werden auf der Trefferliste präsentiert?
* Welche Verzeichnungsstufen sind vertreten?
* Sind die ISAD(G)-Informationsbereiche erkennbar?
* Decken sich die grundlegenden Informationen oder gibt es bemerkenswerte Unterschiede?
* Worin liegen die zentralen Unterschiede zu einem Bibliothekskatalog?

View File

@ -0,0 +1,48 @@
# 2.3 Online-Präsentation von Digitalisaten
Für die Präsentation der Digitalisate kommen an der ETH-Bibliothek verschiedene spezialisierte Systeme zum Einsatz. Diese verfolgen unterschiedliche Ansätze abhängig von Medienform und Zielgruppe.
## Präsentation im Archivinformationssystem
* Vorschaubild in der Treffer- und/oder Detailansicht
* Viewer für Zusatzfunktionen (Zoom, Druck, Download etc.)
### Beispiel [Staatsarchiv Basel-Stadt](https://query.staatsarchiv.bs.ch/query/detail.aspx?ID=84077)
![Staatsarchiv Basel-Stadt](../images/staatsarchiv-basel-stadt.png)
### Beispiel [Landesarchiv Baden-Württemberg](https://www2.landesarchiv-bw.de/ofs21/olf/struktur.php?bestand=20501&sprungId=1412361&letztesLimit=suchen)
![Landesarchiv Baden-Württemberg](../images/landesarchiv-baden-wuerttemberg.png)
## Präsentation in Digital Asset Management Systemen
Für Anzeige und Zugriff auf digital assets optimiert:
* Hohe Skalierbarkeit
* Download in unterschiedlichen Auflösungen
* Download in Abhängigkeit vom Rechtevermerk
### Beispiel [E-Pics Plattform der ETH Zürich](https://www.e-pics.ethz.ch/de/home/)
[Bildarchiv Online](http://ba.e-pics.ethz.ch) mit rund 390000 Digitalisaten (Stand Ende September 2017):
![Bildarchiv Online](../images/bildarchiv-online.png)
## Präsentation von Handschriften und alten Drucken
### Beispiel [e-manuscripta.ch](http://www.e-manuscripta.ch) - Kooperative Präsentationsplattorm für handschriftliche Quellen
* Digitalisate aus mehreren Instiutionen (ZB Zürich, UB Basel, ETH-Bibliothek u. a. m.)
* Höheres Volumen stärkt Sichtbarkeit und Attraktivität
* Geteilte Kosten für Betrieb und Weiterentwicklung
* Koordination: ZB Zürich, Hosting: ETH-Bibliothek
* Laufendes Projekt: Erweiterung um ein crowdfähiges Transkriptionsmodul
* System: Visual Library der Firma semantics GmbH
* Angebundene Quellsysteme (mit Rückverlinkung):
* Aleph, Modul des Verbundes Handschriften, Archive, Nachlässe (HAN)
* scopeArchiv (Schweizerisches Literaturarchiv)
* CMISTAR (Hochschularchiv der ETH Zürich)
* analog dazu [e-rara.ch](http://www.e-rara.ch/) für alte Drucke
![e-manuscripta.ch](../images/e-manuscripta.png)

View File

@ -0,0 +1,46 @@
# 2.4 Discovery-System Wissensportal
Wie in [Kapitel 2.1](21_metadatenflusse-der-eth-bibliothek.md) beschrieben, werden alle Ressourcen im "Wissensportal" zusammengeführt, um eine übergreifende Suche für die Nutzer zu ermöglichen. Das [Wissensportal](http://www.library.ethz.ch/) ist das zentrale Discovery-Tool für Recherchen in den Informationsquellen der ETH-Bibliothek. Es integriert Daten aus dem Bibliothekssystem Aleph und mehreren Fachanwendungen. Das Discovery-System ist mit dem Produkt [Primo](http://www.exlibrisgroup.com/de/category/Primo) realisiert.
## Zweck des Discovery-Systems
* Verbesserung der Suchfunktionen des OPACs
* Integration aller Ressourcen (nicht nur klassische Bibliotheksdaten) in eine Suchoberfläche
* Zusätzliche lizenzpflichtige Ressourcen können direkt von den Herstellern bezogen und im Discovery-Tool nachgewiesen werden
## Datenfluss ins Wissensportal
Datenquellen kommen über sogenannte "Pipes" ins System, die in Primo konfiguriert werden können:
1. Harvesting (via Dateisystem oder OAI)
2. Normalisierung der Daten und Speicherung in eigenem Format (PNX)
3. Indexierung der Daten
Bei der Normalisierung der Daten für die übergreifende Suche im Wissensportal ist ein Informationsverlust nicht immer zu vermeiden. Gleichzeitig werden bei der Zusammenführung ins "Wissensportal" auch Daten (z.B. aus Normdaten) angereichert, so dass für bestimmte Daten auch ein Informationsgewinn im Vergleich zum Quellsystem entstehen kann.
## Beispiel Hochschularchiv
Die Daten des Hochschularchivs werden von der Software Primo über eine spezielle OAI-PMH-Schnittstelle (vgl. dazu [Kapitel 2.6](26_datenbereitstellung-fur-externe-portale.md)) der Archivsoftware CMISTAR eingesammelt.
Dabei müssen die hierarchisch gegliederten Erschließungsinformationen (nach ISAD(G)) in eine flache Struktur gebracht werden. Dazu wird jede Verzeichnungseinheit innerhalb der Tektonik als einzelner Datensatz im Wissensportal abgebildet.
## Übung: Vergleich Archivsystem und Discovery-System
Vergleichen Sie die Einträge im Archivsystem und im Wissensportal am Beispiel einer Postkarte von Albert Einstein an Alfred Stern.
1. [Datensatz im Archivsystem](http://archivdatenbank-online.ethz.ch/hsa/#/content/d8edf79020994271b0b8289728f7624d)
2. [Datensatz im Wissensportal](http://www.library.ethz.ch/DADS:default_scope:cmistard8edf79020994271b0b8289728f7624d) (siehe auch: [Internes Format (PNX)](http://www.library.ethz.ch/DADS:default_scope:cmistard8edf79020994271b0b8289728f7624d&showPnx=true))
Fragen:
* Wie werden Informationen zur Erschließungshierarchie im Wissensportal abgebildet? (in der Trefferliste und in der Detailansicht)
* Welche Informationen fließen in die Facetten des Wissensportals ein?
* Fehlen Ihnen im Wissensportal entscheidende Informationen?
* Welche Art der beiden Suchen und Anzeigen bevorzugen Sie? Weshalb?
## Diskussion: Discovery oder Spezialdatenbank?
Um zu klären, welche Metadaten in das Discovery-System (hier: Wissensportal) übernommen werden, muss geklärt werden, welche Informationen zu welchem Zeitpunkt für die Nutzer relevant sind. Es gibt unterschiedliche Erwartungen der Nutzer, welche Informationen Sie in den verschiedenen Rechercheangeboten erhalten.
Das Wissensportal der ETH-Bibliothek ist als übergreifende Suche konzipiert, während die weiteren Recherchesysteme als Spezialdatenbanken für vertiefende Recherchen gedacht sind. Das Discovery-System soll unter anderem durch die Zusammenführung von unterschiedlichen Bibliotheks- und Archivressourcen das Prinzip der [Serendipity](https://de.wikipedia.org/wiki/Serendipit%C3%A4t) unterstützen.
Diesem Konzept folgend wird im Wissensportal aus allen Systemen eine leicht reduzierte Informationsmenge zusammengeführt, quasi den "größten gemeinsamen Nenner". Gleichzeitig werden Informationen wie beispielsweise Cover für eine visuelle Orientierung sowie Verfügbarkeitsinformationen bei der Zusammenführung ergänzt.

View File

@ -0,0 +1,32 @@
# 2.5 Datenbereitstellung für externe Portale
## Ziele
* Mehrwert für Benutzende schaffen: Übergreifende Suche
* Eigene Sichtbarkeit und Reichweite erhöhen
* Dahin gehen, wo die Nutzer sind
## Beispiel Archivportale
Es existiert eine facettenreiche (Archiv-)Portallandschaft. Ein Überblick ist kürzlich (September 2017) im [Whitepaper Portale](http://vsa-aas.ch/ressourcen/zugang-und-vermittlung/whitepaper-portale/) des Vereins Schweizerischer Archivarinnen und Archivare erschienen.
Der Fokus der ETH-Bibliothek liegt auf dem Bereitstellen einer OAI-PMH-Schnittstelle, damit Portale die Daten "einsammeln" können. Für die Integration der Daten ins Portal [Archives Portal Europe](https://www.archivesportaleurope.net) generiert die Archivsoftware CMISTAR das Format EAD2002 und bietet es über eine OAI-PMH-Schnittstelle an. Das Archives Portal Europe sammelt diese Daten dann regelmäßig ein.
## OAI-PMH
Im Jahr 2000 hat die internationale [Open Archives Initiative](http://www.openarchives.org/) ein Protokoll verabschiedet, um die Interoperabilität zwischen Repositorien von Bibliotheken zu verbessern.
Das OAI Protocol for Metadata Harvesting ([OAI-PMH](https://www.openarchives.org/OAI/openarchivesprotocol.html)) organisiert den Datenaustausch zwischen Data Providern und Service Providern und bietet unter anderem folgende Funktionen:
* Anfrage: Einfaches Set an OAI-PMH requests (ListRecords, GetRecord ...)
* Antwort: XML-codierte Ausgabe
* Selektives Harvesting dank Zeitstempel (z. B. alle Datensätze ab dem 29.09.2017)
* Format der Datensätze kann unterschiedlich sein: Dublin Core, MARC, EAD usw.
## Beispiel einer OAI-PMH-Schnittstelle
Es gibt viele verschiedene Software-Implementierungen des OAI-PMH-Standards. Eine [Übersicht von Tools](https://www.openarchives.org/pmh/tools/) wird auf der Webseite der Open Archives Initiative geführt.
Repositoriensoftware wie die Archivsoftware CMISTAR haben oftmals eine OAI-PMH-Schnittelle integriert. Es gibt aber auch einige einfache Implementierungen. Hier ein [Beispiel](http://demo.opencultureconsulting.com/oai_pmh/?verb=ListRecords&metadataPrefix=oai_dc):
![Beispiel für OAI-PMH Data Provider](../images/oai-pmh-beispiel.png)