vufindtutorialde/11_Datenimport_MARC21_MARCX...

76 lines
2.7 KiB
Markdown
Raw Permalink Normal View History

2017-10-01 17:47:05 +02:00
# Datenimport MARC21 MARCXML
In diesem Kapitel nutzen wir exemplarisch Daten aus dem TIBKAT der Technischen Informationsbibliothek. Diese stehen als sogenannte Open Data zur Verfügung.
## Download
Öffnen Sie die Webseite des Open Data Service der TIB:
<http://www.tib-hannover.de/de/dienstleistungen/opendata/download/4/>
Lesen Sie die Lizenzbedingungen und bestätigen Sie diese:
![](media/11/image1.png)
Wählen Sie „OK“ aus.
Auf der nächsten Seite werden eine Beispieldatei und die Daten selbst zum Download angeboten:
![](media/11/image2.png)
2019-12-03 01:17:37 +01:00
Laden Sie die erste Datei `tibkat_full_20121030_1_of_4.tgz` in das Verzeichnis `Downloads` in Ihrem Homeverzeichnis herunter.
2017-10-01 17:47:05 +02:00
## Entpacken
2019-12-03 01:17:37 +01:00
Entpacken Sie die heruntergeladene Datei in das Verzeichnis `/usr/local/vufind2/local/harvest/`. Wählen Sie dazu die Datei im Dateimanager aus und klicken Sie dann im Kontextmenü „Entpacken nach…“ (ohne Abbildung) an. Die Archivdatei enthält ein Verzeichnis namens `tibkat_full_20150305_1_of_4`. In diesem Verzeichnis befinden sich die Daten in einzelnen MARCXML-Dateien. Jede Datei enthält 2.000 Datensätze.
2017-10-01 17:47:05 +02:00
Da wir uns im Rahmen des Tutorials mit dem Import vertraut machen wollen, werden wir nur insgesamt 50.000 Datensätze importieren.
2019-12-03 01:17:37 +01:00
Erstellen Sie im Verzeichnis `/usr/local/vufind2/local/harvest/`ein neues Verzeichnis namens `TIBKAT`. Kopieren Sie die ersten 25 XML-Dateien aus dem Verzeichnis `tibkat_full_20150305_1_of_4 ` in das Verzeichnis `TIBKAT`.
2017-10-01 17:47:05 +02:00
## Import vorbereiten
2019-12-03 01:17:37 +01:00
Öffnen Sie mit Mousepad die Datei `marc_local.properties` im Verzeichnis `/usr/local/vufind2/import/`. Ändern Sie die beim Testimport editierten Werte „collection“ und „institution“ wie folgt:
2017-10-01 17:47:05 +02:00
```
collection = "TIBKAT"
institution = "TIB"
```
## Import durchführen
Starten Sie VuFind.
Führen Sie im Terminal die folgenden Befehle aus:
2019-12-03 01:17:37 +01:00
```bash
2017-10-01 17:47:05 +02:00
cd /usr/local/vufind2/harvest/
./batch-import-marc.sh TIBKAT
```
Der zweite Befehl startet den Import. Dieser verarbeitet nacheinander die einzelnen XML-Dateien und meldet den Import jedes Datensatzes im Terminal:
![](media/11/image3.png)
Während des Importes werden die importierten Dateien in ein Verzeichnis
2019-12-03 01:17:37 +01:00
namens `processed` verschoben. Wird der Import nach einer Unterbrechung fortgesetzt, werden do die Dateien im Ordner `processed` nicht nochmals importiert.
2017-10-01 17:47:05 +02:00
## VuFind neu starten und Index optimieren
Starten Sie VuFind neu.
Optimieren Sie den Index.
## Import kontrollieren
Führen Sie eine leere Suche in VuFind durch:
![](media/11/image4.png)
Anhand der Facette „Bestand“ können Sie sehen, dass zu den 2519 Datensätzen aus der DNB-Reihe A nun 50.000 Datensätze aus dem TIBKAT hinzugekommen sind.
## Quellen
MARC Records. VuFind Documentation.
2019-12-03 01:17:37 +01:00
<https://vufind.org/wiki/importing_records>