bibliotheks-und-archivinfor.../03_funktion-und-aufbau-von-...

17 KiB
Raw Blame History

Funktion und Aufbau von Archivsystemen

  • Metadatenstandards in Archiven (ISAD(G) und EAD)
  • Installation und Konfiguration von ArchivesSpace
  • Marktüberblick Archivsysteme

Metadatenstandards in Archiven (ISAD(G) und EAD)

ISAD(G)

  • Als digitale Archivsysteme entwickelt wurden, orientierte sich die Datenstruktur an analogen Findmitteln wie Findbüchern und Zettelkästen.
  • Ein wichtiger Verzeichnungsstandard im Archivwesen wurde 1994 (Revision 2000) eingeführt, die "International Standard Archival Description (General)" - kurz ISAD(G).
  • Grundsätzlich gibt es hier eine mehrstufige Verzeichnung im Provenienzprinzip, um den Entstehungszusammenhang abzubilden.

Informationsbereiche

Der Standard enthält 26 Verzeichnungselemente in 7 Informationsbereichen:

  1. Identifikation
  2. Kontext
  3. Inhalt und innere Ordnung
  4. Zugangs- und Benutzungsbedingungen
  5. Sachverwandte Unterlagen
  6. Anmerkungen
  7. Kontrolle

Pflichtfelder

Von besonderer Bedeutung sind 6 Pflichtfelder:

  • Signatur
  • Titel
  • Provenienz
  • Entstehungszeitraum
  • Umfang
  • Verzeichnungsstufe

Grenzen von ISAD(G)

  1. Ein einzelner Datensatz ist unter Umständen nur im Kontext verständlich (z. B. nur "Protokoll" als Titel).
  2. Die Tektonik ist eindimensional (keine Mehrfachzuordnung möglich).
  3. Der Standard enthält keine Vorgaben zur Digitalisierung oder zur digitalen Langzeitarchivierung.

Normdaten mit ISAD(G)

  • Um Normdateien verzeichnen zu können, wurde später ein ergänzender Standard "International Standard Archival Authority Record for Corporate Bodies, Persons, and Families" - kurz ISAAR(CPF) verabschiedet. Dieser wird in der Praxis wegen dem Zusatzaufwand bei der Erschließung jedoch nur selten verwendet.
  • Aktuell ist ein neuer Standard "Records in Contexts" (RIC) in Entwicklung. Dieser basiert auf Linked-Data-Prinzipien und soll neue und mehrfache Beziehungen zwischen Entitäten ermöglichen.

Note:

  • In den Archiven der ETH-Bibliothek ist wegen der Bibliothekszugehörigkeit die GND-ID von besonderer Bedeutung.
  • Projektgruppe ENSEMEN arbeitet an einer schweizerischen Ausprägung des neuen Standards Records in Contexts (RiC), mit Beteiligung von Niklaus Stettler (FH Graubünden)

Übung: Archivkataloge

Aufgabe (20 Minuten):

  • Suchen Sie nach:
  • Beantworten Sie die folgenden Fragen:
    1. Welche Informationen enthält die Trefferliste?
    2. Welche Verzeichnungsstufen sind vertreten?
    3. Sind die ISAD(G)-Informationsbereiche erkennbar?
    4. Decken sich die grundlegenden Informationen oder gibt es bemerkenswerte Unterschiede?
    5. Worin liegen die zentralen Unterschiede zu einem Bibliothekskatalog?
  • Zum Nachschlagen: ISAD(G) Guidelines

EAD

Note:

  • Wir werden später praktisch mit EAD-Dateien arbeiten, daher hier nur diese Kurzinfo.
  • Die Präsentationsfolien von Nicolas Moretto geben einen guten Überblick über EAD2002.
  • Liste der Elemente in EAD2002: https://eadiva.com/2/elements/

Aktuelle Entwicklungen

  • Umstieg von ISAD(G) auf RiC wird mit viel Aufwand verbunden sein, auch mit einem Systemwechsel.
  • Generierung von mehr Volltexten u.a. durch Optical Character Recognition (OCR) auch für Handschriften. Automatisierte Anreicherung von Volltexten durch Named Entity Recognition.
  • In Wikidata werden Online-Findmittel über Property Archives at verzeichnet. Beispiel Albert Einstein in Wikidata.
  • In der Schweiz gibt es eine Vernetzungsinitiative Metagrid und weitere Dienste von histHub, einer Forschungsplattform für die Historischen Wissenschaften.
  • Literaturempfehlung: Umfrage "Was sich Historiker*innen von Archiven wünschen"

Installation und Konfiguration von ArchivesSpace

Einführung in ArchivesSpace

  • Open-Source-Software für Archivinformationssysteme
  • 400 zahlende Mitglieder, woraus fast 5 Vollzeitstellen finanziert werden.
  • Code bei GitHub: https://github.com/archivesspace/archivesspace
  • ArchivesSpace ist institutionell verankert bei Lyrasis, einem internationalen "nonprofit" Bibliotheksnetzwerk vorrangig aus den USA. Es gibt auch zwei weitere Unternehmen, die dazu professionellen Support anbieten.

Funktionen

"What ASpace does and how do we use it" (aus Fortbildungsmaterialien der NYU)

  • System of record for archival materials. Not everything is public, or open to staff, nor is it intended to be.
  • Perform core archival functions: accessioning, arrangement and description
  • Aid in public services
  • Record and report location holdings information; stacks management
  • Manage digital objects
  • Produce access tools
  • Statistics gathering, prioritization, holistic planning
  • Contribute to various interdepartmental processes (preservation and digitization)

Metadaten in ArchivesSpace

  • basiert auf den Standards DACS, ISAD(G) und ISAAR(CPF)
  • unterstützt Import/Export in EAD, MARCXML und METS

Exkurs zur Systemadministration

Wir haben auf unserem Server bereits Koha installiert. Gibt es Probleme wenn wir ArchivesSpace zusätzlich installieren?

  • Es könnten Versions- oder Ressourcenkonflikte entstehen.
  • Best Practice: Jedes System in einer eigenen Umgebung.
  • Koha und ArchivesSpace vertragen sich aber zufällig gut, daher installieren wir hier ArchivesSpace einfach zusätzlich.

Note:

  • Es könnte Konflikte geben, wenn die Systeme unterschiedliche Versionen der gleichen Programmiersprache (z.B. Java, PHP) oder der Datenbank (z.B. MySQL, PostgreSQL) benötigen. Es könnten auch die Ressourcen (insbesondere Arbeitsspeicher) knapp werden.
  • Um den Wartungsaufwand zu reduzieren und Ressourcen zu sparen, werden üblicherwese virtuelle Maschinen oder Container eingesetzt.

Installation ArchivesSpace 2.8.0

  1. Java 8 installieren
sudo apt update
sudo apt install openjdk-8-jre-headless
  1. Zip-Archiv herunterladen und entpacken
wget https://github.com/archivesspace/archivesspace/releases/download/v2.8.0/archivesspace-v2.8.0.zip
unzip -q archivesspace-v2.8.0.zip
  1. ArchivesSpace starten
archivesspace/archivesspace.sh

Note:

  • Während Koha in der Standardinstallation so eingerichtet ist, dass es automatisch beim Systemstart zur Verfügung steht, muss ArchivesSpace in der Standardinstallation manuell gestartet werden.
  • Es ist nur solange verfügbar wie der Prozess im Terminal läuft. Es handelt sich um eine Webanwendung. Im Terminal läuft die Server-Applikation. Über den Browser greifen wir darauf zu. Wenn das Terminal geschlossen wird, dann wird auch der Server beendet und die Webseite im Browser ist nicht mehr erreichbar.
  • ArchivesSpace kann auch betrieben werden, ohne ständig die Shell geöffnet haben zu müssen. Im Linux-Kontext spricht man bei im Hintergrund laufenden Programmen von Daemon. Ein Programm kann von der Shell im Hintergrund gestartet werden, in dem am Ende des Aufrufs ein & angefügt wird.

ArchivesSpace aufrufen

Nach ein paar Minuten sollte ArchivesSpace unter folgenden URLs erreichbar sein:

Zugangsdaten für das "Staff Interface" sind:

  • Username: admin
  • Password: admin

Note:

  • Da es sich um eine lokale Installation handelt, sind die Adressen nur über den Webbrowser innerhalb der Virtuellen Maschine erreichbar.

Grundkonfiguration ArchivesSpace

Repository anlegen

Nach dem ersten Login erscheint die Meldung:

To create your first Repository, click the System menu above and then Manage Repositories.

Dort nutzen Sie den Button Create Repository um ihr Repository anzulegen.

  • Notwendig sind zunächst nur Repository Short Name und Repository Name.
  • Die Checkbox Publish? definiert, ob die Daten im "public interface" unter http://localhost:8081 erreichbar sind.

Konfigurationsmöglichkeiten

Bedienung

  • Wir nutzen nun die zuvor diskutierten Grundlagen und die Erfahrungen aus der Übung zu "Einstein", um Datensätze in ArchivesSpace zu erschließen.
  • Versuchen Sie bei der folgenden Gruppenarbeit intuitiv vorzugehen und tauschen Sie sich untereinander aus.
  • Denken Sie an das Provenienzprinzip. Jede Ressource, die Sie verzeichnen wollen, benötigt zunächst Informationen zur Herkunft (Akzession).

Begrifflichkeiten

  • Accession: Dokumentation der Erwerbung, wegen vertraulichen Angaben oft nicht öffentlich
  • Resource: Zentraler Nachweis auf der obersten Ebene der Verzeichnungsstufen, zum Beispiel zu einem Nachlass (kann aber auch direkt zum Objekt sein, wenn die Resource nur eine Verzeichnungsstufe hat)
  • Archival Object: Nachweis von Objekten auf weiteren Verzeichnungsstufen (Bestand/Fonds, Serie/Series, Akte/File, Einzelstück/Item). Sie werden als "Add Child" an vorhandene Resources gehängt.

Note:

Übung: Datensätze erstellen

Aufgabe (40 Minuten)

  • Aufgabe: Erstellen Sie eigene Datensätze in Ihrer ArchivesSpace Installation. Erfinden Sie dazu sinnvolle Archivdaten oder suchen Sie sich Beispieldaten (z.B. im Hochschularchiv der ETH).
  • Ziel: Ihre Datensätze erscheinen in der öffentlichen Ansicht unter http://localhost:8081. Machen Sie einen Screenshot und laden Sie das Bild hier in das gemeinsame Dokument.
  • Hinweis: Orientieren Sie sich beim Vorgehen an der Übung der NYU: Create Your Own Record

Import und Export

ArchivesSpace bietet dateibasierten Import und Export in diversen Formaten (EAD, MARCXML, CSV) und auch eine OAI-PMH-Schnittstelle.

In den folgenden zwei Übungen werden wir EAD-Beispieldaten in ArchivesSpace importieren und anschließend in MARCXML exportieren.

Übung: Import

Aufgabe (15 Minuten)

  • Beispieldaten: https://eadiva.com/2/sample-ead2002-files/ (laden Sie eine der als "a raw XML file" verlinkten Dateien herunter)
  • Aufgabe: Importieren Sie Beispieldaten im Format EAD in ArchivesSpace. Vergleichen Sie (ganz grob) die Anzeige in ArchivesSpace mit der bei den Beispieldaten verlinkten HTML-Ansicht.
  • Ziel: Dokumentieren Sie Ihre Erkenntnisse unten im gemeinsamen Dokument.
  • Hinweis: Die Import-Funktion finden Sie etwas versteckt unter Create > Background Job > Import Data

Note:

  • Import kann etwas länger dauern weil,
    • wir nur die mitgelieferte Datenbank (für Testzwecke) verwendet haben und keine separate MySQL-Datenbank
    • EAD ein komplexes Dateiformat ist, was etwas aufwendiger auszuwerten ist (daher auch die mehreren "Cycles" in der Log-Datei)
    • ArchivesSpace in der Grundeinstellung nur 1 GB RAM benutzt, siehe Dokumentation zu "Tuning": http://archivesspace.github.io/archivesspace/user/tuning-archivesspace/

Übung: Export

Aufgabe (15 Minuten)

  • Aufgabe:
    1. Exportieren Sie die von Ihnen zuvor importierten Datensätze im Format MARCXML. Speichern Sie die Datei auf der Festplatte.
    2. Vergleichen Sie die exportierte MARCXML-Datei kurz mit den in ArchivesSpace vorhandenen Informationen. Ist der Export in MARCXML verlustfrei?
  • Ziel: Dokumentieren Sie Ihre Erkenntnisse unten im gemeinsamen Dokument.
  • Hinweis: Die Export-Funktion finden Sie etwas versteckt in der Button-Leiste bei der "Resource".

Note:

Literatur zu ArchivesSpace

Note:

  • Das Benutzerhandbuch von ArchivesSpace steht nur zahlenden Mitgliedern zur Verfügung. Bei Open-Source-Software suchen die Communities oft nach einem Zusatzvorteil für Mitglieder, weil die Software selbst ja kostenfrei erhältlich ist. Wirklich "open" ist diese Zurückhaltung von Informationen nicht so recht.

Marktüberblick Archivsysteme

Note:

  • In den Archiven der ETH-Bibliothek wird CMI STAR verwendet. Im "Rich-Client" (Programm für die Mitarbeiter*innen) wird die Erschließung anhand der ISAD(G) Informationsbereiche kategorisiert. CMI STAR beinhaltet auch ein grafisches Mapping-Tool für den Import von Excel oder CSV. Das wird verwendet, um Eingaben von Hilfskräften in Excel in das System zu importieren.

Unterschiede zwischen Bibliotheks- und Archivsystemen

  • Bibliothek
    • (Massen-)Medium, Benutzerinteraktion (Ausleihe)
    • Software medienzentriert
    • Metadatenformat: MARC21, zukünftig BIBFRAME?
  • Archiv
    • Entstehungszusammenhang, eher stehender, unikaler Bestand (Nutzung auf Anfrage)
    • Software orientiert sich an analogen Findmitteln
    • Metadatenformat: EAD, zukünftig RiC

Note:

  • Herausforderung: Datenaustausch zwischen den Systemen (kommen wir später darauf zurück)

Aufgaben

Bis zum nächsten Termin:

  1. Beitrag im Lerntagebuch zu dieser Lehreinheit
  2. Datensätze in ArchivesSpace vervollständigen. Mindestens Accession und Resource. Beides sollte unter http://localhost:8081 (öffentliche Ansicht) erscheinen.