# Datenimport MARC21 MARCXML In diesem Kapitel nutzen wir exemplarisch Daten aus dem TIBKAT der Technischen Informationsbibliothek. Diese stehen als sogenannte Open Data zur Verfügung. ## Download Öffnen Sie die Webseite des Open Data Service der TIB: Lesen Sie die Lizenzbedingungen und bestätigen Sie diese: ![](media/11/image1.png) Wählen Sie „OK“ aus. Auf der nächsten Seite werden eine Beispieldatei und die Daten selbst zum Download angeboten: ![](media/11/image2.png) Laden Sie die erste Datei `tibkat_full_20121030_1_of_4.tgz` in das Verzeichnis `Downloads` in Ihrem Homeverzeichnis herunter. ## Entpacken Entpacken Sie die heruntergeladene Datei in das Verzeichnis `/usr/local/vufind2/local/harvest/`. Wählen Sie dazu die Datei im Dateimanager aus und klicken Sie dann im Kontextmenü „Entpacken nach…“ (ohne Abbildung) an. Die Archivdatei enthält ein Verzeichnis namens `tibkat_full_20150305_1_of_4`. In diesem Verzeichnis befinden sich die Daten in einzelnen MARCXML-Dateien. Jede Datei enthält 2.000 Datensätze. Da wir uns im Rahmen des Tutorials mit dem Import vertraut machen wollen, werden wir nur insgesamt 50.000 Datensätze importieren. Erstellen Sie im Verzeichnis `/usr/local/vufind2/local/harvest/`ein neues Verzeichnis namens `TIBKAT`. Kopieren Sie die ersten 25 XML-Dateien aus dem Verzeichnis `tibkat_full_20150305_1_of_4 ` in das Verzeichnis `TIBKAT`. ## Import vorbereiten Öffnen Sie mit Mousepad die Datei `marc_local.properties` im Verzeichnis `/usr/local/vufind2/import/`. Ändern Sie die beim Testimport editierten Werte „collection“ und „institution“ wie folgt: ``` collection = "TIBKAT" institution = "TIB" ``` ## Import durchführen Starten Sie VuFind. Führen Sie im Terminal die folgenden Befehle aus: ```bash cd /usr/local/vufind2/harvest/ ./batch-import-marc.sh TIBKAT ``` Der zweite Befehl startet den Import. Dieser verarbeitet nacheinander die einzelnen XML-Dateien und meldet den Import jedes Datensatzes im Terminal: ![](media/11/image3.png) Während des Importes werden die importierten Dateien in ein Verzeichnis namens `processed` verschoben. Wird der Import nach einer Unterbrechung fortgesetzt, werden do die Dateien im Ordner `processed` nicht nochmals importiert. ## VuFind neu starten und Index optimieren Starten Sie VuFind neu. Optimieren Sie den Index. ## Import kontrollieren Führen Sie eine leere Suche in VuFind durch: ![](media/11/image4.png) Anhand der Facette „Bestand“ können Sie sehen, dass zu den 2519 Datensätzen aus der DNB-Reihe A nun 50.000 Datensätze aus dem TIBKAT hinzugekommen sind. ## Quellen MARC Records. VuFind Documentation.