# Funktion und Aufbau von Archivsystemen * Metadatenstandards in Archiven (ISAD(G) und EAD) * Installation und Konfiguration von ArchivesSpace * Marktüberblick Archivsysteme ## Metadatenstandards in Archiven (ISAD(G) und EAD) ### Regelwerk: ISAD(G) * Als digitale Archivsysteme entwickelt wurden, orientierte sich die Datenstruktur an analogen Findmitteln wie Findbüchern und Zettelkästen. * Ein wichtiger Verzeichnungsstandard im Archivwesen wurde 1994 (Revision 2000) eingeführt, die "International Standard Archival Description (General)" - kurz [ISAD(G)](https://de.wikipedia.org/wiki/ISAD(G)). * Grundsätzlich gibt es hier eine mehrstufige Verzeichnung im Provenienzprinzip, um den Entstehungszusammenhang abzubilden. #### Informationsbereiche Der Standard enthält 26 Verzeichnungselemente in 7 Informationsbereichen: 1. Identifikation 2. Kontext 3. Inhalt und innere Ordnung 4. Zugangs- und Benutzungsbedingungen 5. Sachverwandte Unterlagen 6. Anmerkungen 7. Kontrolle #### Pflichtfelder Von besonderer Bedeutung sind 6 Pflichtfelder: * Signatur * Titel * Provenienz * Entstehungszeitraum * Umfang * Verzeichnungsstufe #### Grenzen von ISAD(G) 1. Ein einzelner Datensatz ist unter Umständen nur im Kontext verständlich (z. B. nur "Protokoll" als Titel). 2. Die Tektonik ist eindimensional (keine Mehrfachzuordnung möglich). 3. Der Standard enthält keine Vorgaben zur Digitalisierung oder zur digitalen Langzeitarchivierung. #### Normdaten mit ISAD(G) * Um Normdateien verzeichnen zu können, wurde später ein ergänzender Standard "International Standard Archival Authority Record for Corporate Bodies, Persons, and Families" - kurz [ISAAR(CPF)](https://de.wikipedia.org/wiki/ISAAR(CPF)) verabschiedet. Dieser wird in der Praxis wegen dem Zusatzaufwand bei der Erschließung jedoch nur selten verwendet. * Aktuell ist ein neuer Standard ["Records in Contexts" (RIC)](https://de.wikipedia.org/wiki/Records_in_Contexts) in Entwicklung. Dieser basiert auf Linked-Data-Prinzipien und soll neue und mehrfache Beziehungen zwischen Entitäten ermöglichen. Note: - In den Archiven der ETH-Bibliothek ist wegen der Bibliothekszugehörigkeit die [GND](https://de.wikipedia.org/wiki/Gemeinsame_Normdatei)-ID von besonderer Bedeutung. - Projektgruppe [ENSEMEN](https://vsa-aas.ch/arbeitsgruppen/projektgruppe-ensemen/) arbeitet an einer schweizerischen Ausprägung des neuen Standards [Records in Contexts](https://www.ica.org/en/records-contexts-german) (RiC), mit Beteiligung von Niklaus Stettler (FH Graubünden) ### Übung: Archivkataloge **Aufgabe (20 Minuten):** * Suchen Sie nach: * `Einstein` im [Online Archivkatalog des Staatsarchivs BS](https://query.staatsarchiv.bs.ch/query/suchinfo.aspx) * `Einstein Ehrat` im [Hochschularchiv ETH Zürich](http://archivdatenbank-online.ethz.ch/) * Beantworten Sie die folgenden Fragen: 1. Welche Informationen enthält die Trefferliste? 2. Welche Verzeichnungsstufen sind vertreten? 3. Sind die ISAD(G)-Informationsbereiche erkennbar? 4. Decken sich die grundlegenden Informationen oder gibt es bemerkenswerte Unterschiede? 5. Worin liegen die zentralen Unterschiede zu einem Bibliothekskatalog? * Zum Nachschlagen: [ISAD(G) Guidelines](https://www.ica.org/sites/default/files/CBPS_2000_Guidelines_ISAD(G)_Second-edition_DE.pdf) ### Datenformat: EAD * [Encoded Archival Description](https://de.wikipedia.org/wiki/Encoded_Archival_Description) (EAD) ist ein XML-Standard * Verschiedene Versionen: EAD2002 und EAD3 (seit 2015; aktuell ist 1.1.1 von 2019) * Lässt viele Wahlmöglichkeiten offen, daher gibt es oft Anwendungsprofile, die genauer spezifizieren welche Werte zugelassen sind. * Anwendungsfälle: [Archives Portal Europa](https://www.archivesportaleurope.net/de/), [Archivportal-D](https://www.archivportal-d.de), [Kalliope](https://kalliope-verbund.info) * Einführung: [Nicolas Moretto (2014): EAD und digitalisiertes Archivgut](https://wiki.dnb.de/download/attachments/90410326/20140414_KIMWS_EAD.pdf?version=1&modificationDate=1398246420000&api=v2). Präsentation auf dem [DINI AG KIM Workshop 2014](https://wiki.dnb.de/display/DINIAGKIM/KIM+WS+2014) in Mannheim. Note: - Wir werden später praktisch mit EAD-Dateien arbeiten, daher hier nur diese Kurzinfo. - Die Präsentationsfolien von Nicolas Moretto geben einen guten Überblick über EAD2002. - Liste der Elemente [in EAD2002](https://eadiva.com/2/elements/) und [in EAD3](https://eadiva.com/elements/) ### Aktuelle Entwicklungen * Umstieg von ISAD(G) auf RiC wird mit viel Aufwand verbunden sein, auch mit einem Systemwechsel. * Generierung von mehr Volltexten u.a. durch Optical Character Recognition (OCR) auch für Handschriften. Automatisierte Anreicherung von Volltexten durch Named Entity Recognition. * In Wikidata werden Online-Findmittel über Property [Archives at](https://www.wikidata.org/wiki/Property:P485) verzeichnet. Beispiel [Albert Einstein in Wikidata](https://www.wikidata.org/wiki/Q937). * In der Schweiz gibt es eine Vernetzungsinitiative [Metagrid](https://metagrid.ch) und weitere Dienste von [histHub](https://histhub.ch), einer Forschungsplattform für die Historischen Wissenschaften. Note: - Literaturempfehlung: [Umfrage "Was sich Historiker*innen von Archiven wünschen"](https://dhdhi.hypotheses.org/6107) ## Installation und Konfiguration von ArchivesSpace ### Einführung in ArchivesSpace * Open-Source-Software für Archivinformationssysteme * 400 zahlende [Mitglieder](http://archivesspace.org/community/whos-using-archivesspace/), woraus fast 5 Vollzeitstellen finanziert werden. * Code bei GitHub: * ArchivesSpace ist institutionell verankert bei [Lyrasis](https://en.wikipedia.org/wiki/Lyrasis), einem internationalen "nonprofit" Bibliotheksnetzwerk vorrangig aus den USA. Es gibt auch zwei weitere Unternehmen, die dazu professionellen Support anbieten. #### Funktionen "What ASpace does and how do we use it" ([aus Fortbildungsmaterialien der NYU](https://guides.nyu.edu/ld.php?content_id=23461999)) * System of record for archival materials. Not everything is public, or open to staff, nor is it intended to be. * Perform core archival functions: accessioning, arrangement and description * Aid in public services * Record and report location holdings information; stacks management * Manage digital objects * Produce access tools * Statistics gathering, prioritization, holistic planning * Contribute to various interdepartmental processes (preservation and digitization) #### Metadaten in ArchivesSpace * basiert auf den Standards [DACS](https://en.wikipedia.org/wiki/Describing_Archives:_A_Content_Standard), ISAD(G) und ISAAR(CPF) * unterstützt Import/Export in EAD, MARCXML und METS ### Exkurs zur Systemadministration Wir haben auf unserem Server bereits Koha installiert. Gibt es Probleme wenn wir ArchivesSpace zusätzlich installieren? * Es könnten Versions- oder Ressourcenkonflikte entstehen. * Best Practice: Jedes System in einer eigenen Umgebung. * Koha und ArchivesSpace vertragen sich aber zufällig gut, daher installieren wir hier ArchivesSpace einfach zusätzlich. Note: - Es könnte Konflikte geben, wenn die Systeme unterschiedliche Versionen der gleichen Programmiersprache (z.B. Java, PHP) oder der Datenbank (z.B. MySQL, PostgreSQL) benötigen. Es könnten auch die Ressourcen (insbesondere Arbeitsspeicher) knapp werden. - Um den Wartungsaufwand zu reduzieren und Ressourcen zu sparen, werden üblicherwese virtuelle Maschinen oder Container eingesetzt. ### Installation ArchivesSpace * Installation war [Aufgabe zur heutigen Sitzung](02_funktion-und-aufbau-von-bibliothekssystemen.md#Aufgaben). * Damit ArchivesSpace verfügbar ist, muss der Prozess im Terminal laufen. Falls zwischenzeitlich geschlossen ggf. noch einmal starten. ```bash archivesspace/archivesspace.sh ``` * Login im Staff Interface unter * Username: `admin` * Password: `admin` Note: - Während Koha in der Standardinstallation so eingerichtet ist, dass es automatisch beim Systemstart zur Verfügung steht, muss ArchivesSpace in der Standardinstallation manuell gestartet werden. - Es ist nur solange verfügbar wie der Prozess im Terminal läuft. Es handelt sich um eine Webanwendung. Im Terminal läuft die Server-Applikation. Über den Browser greifen wir darauf zu. Wenn das Terminal geschlossen wird, dann wird auch der Server beendet und die Webseite im Browser ist nicht mehr erreichbar. ### Grundkonfiguration ArchivesSpace #### Repository anlegen Nach dem ersten Login erscheint die Meldung: > To create your first Repository, click the **System** menu above and then **Manage Repositories**. Dort nutzen Sie den Button `Create Repository` um ihr Repository anzulegen. * Notwendig sind zunächst nur `Repository Short Name` und `Repository Name`. * Die Checkbox `Publish?` definiert, ob die Daten im "public interface" unter erreichbar sind. #### Konfigurationsmöglichkeiten * Spracheinstellung: Es gibt noch keine deutsche Übersetzung aber Spanisch, Französisch und Japanisch * Konfiguration: * Sprachdateien: * Weitere Optionen: Siehe technische Dokumentation ### Bedienung * Wir nutzen nun die zuvor diskutierten Grundlagen, um Datensätze in ArchivesSpace zu erschließen. * Versuchen Sie bei der folgenden Gruppenarbeit intuitiv vorzugehen und tauschen Sie sich untereinander aus. * Denken Sie an das Provenienzprinzip. Jede Ressource, die Sie verzeichnen wollen, benötigt zunächst Informationen zur Herkunft (Akzession). #### Begrifflichkeiten * [Accession](https://docs.google.com/document/d/11kWxbFTazB6q5fDNBWDHJxMf3wdVsp8cd7HzjEhE-ao/edit#heading=h.qp2gyscl8fra): Dokumentation der Erwerbung, wegen vertraulichen Angaben oft nicht öffentlich * [Resource](https://docs.google.com/document/d/11kWxbFTazB6q5fDNBWDHJxMf3wdVsp8cd7HzjEhE-ao/edit#heading=h.jvn83ztmj4y4): Zentraler Nachweis auf der obersten Ebene der Verzeichnungsstufen, zum Beispiel zu einem Nachlass (kann aber auch direkt zum Objekt sein, wenn die Resource nur eine Verzeichnungsstufe hat) * [Archival Object](https://docs.google.com/document/d/11kWxbFTazB6q5fDNBWDHJxMf3wdVsp8cd7HzjEhE-ao/edit#heading=h.nscr859g1snm): Nachweis von Objekten auf weiteren Verzeichnungsstufen (Bestand/Fonds, Serie/Series, Akte/File, Einzelstück/Item). Sie werden über "Add Child" an vorhandene Resources gehängt. Note: - Verlinkte Begriffe führen zum [ArchivesSpace Manual for Local Usage at NYU](https://docs.google.com/document/d/11kWxbFTazB6q5fDNBWDHJxMf3wdVsp8cd7HzjEhE-ao/edit), weil das offizielle Handbuch nur für Mitglieder zugänglich ist. #### Übung: Datensätze erstellen **Aufgabe (40 Minuten)** * Aufgabe: Erstellen Sie eigene Datensätze in Ihrer ArchivesSpace Installation. Erfinden Sie dazu sinnvolle Archivdaten oder suchen Sie sich Beispieldaten (z.B. im [Hochschularchiv der ETH](http://archivdatenbank-online.ethz.ch)). * Ziel: Ihre Datensätze erscheinen in der öffentlichen Ansicht unter . Machen Sie einen Screenshot und laden Sie das Bild hier in das gemeinsame Dokument. * Hinweis: Orientieren Sie sich beim Vorgehen an der Übung der NYU: [Create Your Own Record](https://guides.nyu.edu/ld.php?content_id=23198351) ### Literatur zu ArchivesSpace * Einführungsvideos: * ArchivesSpace Wiki: * ArchivesSpace Manual for Local Usage at NYU: Note: - Das Benutzerhandbuch von ArchivesSpace steht nur zahlenden Mitgliedern zur Verfügung. Bei Open-Source-Software suchen die Communities oft nach einem Zusatzvorteil für Mitglieder, weil die Software selbst ja kostenfrei erhältlich ist. Wirklich "open" ist diese Zurückhaltung von Informationen nicht so recht. ## Marktüberblick Archivsysteme * ArchivesSpace hat eine große Community in den USA * Weitere Open-Source-Alternative: [Access to Memory (AtoM)](https://www.accesstomemory.org) * Dienstleister in der Schweiz: [docuteam](https://www.docuteam.ch/atom-access-to-memory/) * Der Markt in der Schweiz wird von den Produkten [scopeArchiv](https://www.scope.ch/de/produkteuebersicht/scopearchiv/) und [CMI AIS](https://cmiag.ch/akten-management/archivierung/ais/) (ehemals CMISTAR) dominiert. * Für die Online-Präsentation von digitalisiertem Archivgut wird oft zusätzliche Software eingesetzt. Beispiele: * [E-Pics Plattform der ETH Zürich](https://www.e-pics.ethz.ch) (WordPress + Canto Cumulus) * [e-manuscripta.ch - Kooperative Präsentationsplattorm für handschriftliche Quellen](http://www.e-manuscripta.ch) (Visual Library) Note: - In den Archiven der ETH-Bibliothek wird CMISTAR verwendet. Im "Rich-Client" (Programm für die Mitarbeiter*innen) wird die Erschließung anhand der ISAD(G) Informationsbereiche kategorisiert. CMISTAR beinhaltet auch ein grafisches Mapping-Tool für den Import von Excel oder CSV. Das wird verwendet, um Eingaben von Hilfskräften in Excel in das System zu importieren. ### Unterschiede zwischen Bibliotheks- und Archivsystemen * Bibliothek * (Massen-)Medium, Benutzerinteraktion (Ausleihe) * Software medienzentriert * Metadatenformat: MARC21, zukünftig BIBFRAME? * Archiv * Entstehungszusammenhang, eher stehender, unikaler Bestand (Nutzung auf Anfrage) * Software orientiert sich an analogen Findmitteln * Metadatenformat: EAD, zukünftig RiC Note: - Herausforderung: Datenaustausch zwischen den Systemen (kommen wir später darauf zurück) ## Aufgaben Bis zum nächsten Termin: 1. Beitrag im Lerntagebuch zu dieser Lehreinheit (3000 - 4000 Zeichen). 2. Datensätze in ArchivesSpace vervollständigen. Mindestens Accession und Resource. Beides sollte unter (öffentliche Ansicht) erscheinen. 3. Übung zu Import und Export (siehe unten) und dazu einen Beitrag im Lerntagebuch verfassen (1000-2000 Zeichen). ### Import und Export ArchivesSpace bietet dateibasierten Import und Export in diversen Formaten (EAD, MARCXML, CSV) und auch eine OAI-PMH-Schnittstelle. In den folgenden zwei Übungen werden wir EAD-Beispieldaten in ArchivesSpace importieren und anschließend in MARCXML exportieren. #### Übung: Import **Aufgabe (15 Minuten)** * Beispieldaten: (laden Sie die als "a raw XML file" verlinkte Datei der "American Association of Industrial Editors" herunter) * Aufgabe: Importieren Sie Beispieldaten im Format EAD in ArchivesSpace. Vergleichen Sie (ganz grob) die Anzeige in ArchivesSpace mit der bei den Beispieldaten verlinkten HTML-Ansicht. * Ziel: Dokumentieren Sie Ihre Erkenntnisse ~~unten im gemeinsamen Dokument.~~ in Ihrem Lerntagebuch. * Hinweis: Die Import-Funktion finden Sie etwas versteckt unter `Create` > `Background Job` > `Import Data` Note: - Import kann etwas länger dauern weil, - wir nur die mitgelieferte Datenbank (für Testzwecke) verwendet haben und keine separate MySQL-Datenbank - EAD ein komplexes Dateiformat ist, was etwas aufwendiger auszuwerten ist (daher auch die mehreren "Cycles" in der Log-Datei) - ArchivesSpace in der Grundeinstellung nur 1 GB RAM benutzt, siehe Dokumentation zu "Tuning": https://archivesspace.github.io/tech-docs/provisioning/tuning.html #### Übung: Export **Aufgabe (15 Minuten)** * Aufgabe: 1. Exportieren Sie die von Ihnen zuvor importierten Datensätze im Format MARCXML. Speichern Sie die Datei auf der Festplatte. 2. Vergleichen Sie die exportierte MARCXML-Datei kurz mit den in ArchivesSpace vorhandenen Informationen. Ist der Export in MARCXML verlustfrei? * Ziel: Dokumentieren Sie Ihre Erkenntnisse unten im gemeinsamen Dokument. * Hinweis: Die Export-Funktion finden Sie etwas versteckt in der Button-Leiste bei der "Resource". Note: - Mappingtabellen als XLS (Stand 2013, unklar ob aktuell) stellt ArchivesSpace auf der Webseite zur Verfügung: - Technische Dokumentation der Konvertierung in MARCXML (falls jemand die Proogrammiersprache Ruby können sollte):