bibliotheks-und-archivinfor.../kapitel-3/33-testdaten-uber-sru-herun...

3.8 KiB

3.3 Testdaten über SRU herunterladen

Wir nutzen die SRU-Schnittstelle von Swissbib.

Auswahl der Testdaten

Als Testdaten laden wir zunächst alles, was der NEBIS-Verbund für eine Suche nach Albert Einstein über alle Felder zu bieten hat etwa 2000 Treffer:

Hier ist die Postkarte von Albert Einstein an Alfred Stern aus Kapitel 2.2 übrigens nicht dabei. Die Daten aus e-manuscripta.ch laden wir erst später in Kapitel 6 als separate Datenquelle.

Abfrage der SRU-Schnittstelle mit einem Shell-Script

Die SRU-Schnittstelle lässt maximal 100 Records pro Abfrage zu, d.h. die Daten müssen in Teilen abgefragt werden:

  1. startRecord=0&maximumRecords=100
  2. startRecord=100& maximumRecords=100
  3. und so weiter...

Um alle Daten herunterzuladen nutzen wir ein vorbereitetes Bash-Script sru-download.sh. Shell-Scripte ermöglichen die Automatisierung von Befehlen auf der Kommandozeile. So müssen Sie nicht alle Befehle nacheinander selbst eintippen, sondern brauchen nur einmal das Script starten und der Computer arbeitet die Befehle selbstständig nacheinander ab. Es können auch Variablen und Schleifen definiert werden, so dass die Befehle dynamisch innerhalb der Laufzeit des Scripts angepasst werden können, was sehr weitreichende Möglichkeiten bietet. Shell-Scripte sind somit ein erster Einstieg in die Programmierung, woher übrigens auch das Schimpfwort "Scriptkiddie" stammt ;-).

Bitte geben Sie die folgenden Befehle in die Kommandozeile ein:

  • Script mit curl auf den Server laden: curl -O https://raw.githubusercontent.com/felixlohmeier/kurs-bibliotheks-und-archivinformatik/master/scripte/sru-download.sh
  • Script ausführbar machen: chmod +x sru-download.sh
  • Script starten mit ./sru-download.sh

Das Script lädt nun die Daten in 100er Paketen und speichert sie als XML-Dateien im Ordner Downloads.

Optional: Individuelle Testdaten laden

Wenn Sie sich eher für Harry Potter als für Albert Einstein interessieren, dann können Sie das Shell-Script anpassen. Öffnen Sie die Datei sru-download.sh mit einem Texteditor (hier: Anwendungen / Zubehör / Pluma Text Editor) und bearbeiten Sie die folgenden Zeilen:

  • Zeile 8: query="dc.anywhere+%3D+Albert+Einstein+AND+dc.xNetwork+%3D+NEBIS" ersetzen durch query="dc.anywhere+%3D+Harry+Potter+AND+dc.xNetwork+%3D+NEBIS"
  • Zeile 11: filename="einstein-nebis" ersetzen durch filename="potter-nebis"

Sie können sich übrigens auch über die Oberfläche von http://sru.swissbib.ch eine beliebige Suchanfrage zusammenstellen. Nach einem Klick auf "Submit Query" erhalten Sie die Ergebnisse und können aus der Adresszeile des Browsers den betreffenden Abschnitt kopieren und in das Shell-Script Zeile 8 einfügen.

Wenn Sie mehr über die Programmierung von Shell-Scripten erfahren wollen, finden Sie Informationen im sehr empfehlenswerten Bash-Skripting-Guide für Anfänger.