diff --git a/README.md b/README.md index bfd28e3..2055212 100644 --- a/README.md +++ b/README.md @@ -66,8 +66,9 @@ Kapitel 5: Katalogsoftware und Suchmaschinenoptimierung \(30.11.2017\) Kapitel 6: Metadaten in Repositorien und Crosswalks \(14.12.2017\) * [6.1 VuFind-Tutorial](/kapitel-6/61_vufind-tutorial.md) -* [6.2 Installation von MarcEdit](/kapitel-6/62_installation-von-marcedit.md) -* [6.3 Harvesting mit MarcEdit](/kapitel-6/63_harvesting-mit-marcedit.md) +* [6.2 Daten im Format MARC21 indexieren](/kapitel-6/62_daten-im-format-marc21-indexieren.md) +* [6.3 Installation von MarcEdit](/kapitel-6/62_installation-von-marcedit.md) +* [6.4 Harvesting mit MarcEdit](/kapitel-6/63_harvesting-mit-marcedit.md) Kapitel 7: Linked Data, weitere Metadatenstandards, Abschluss \(11.01.2018\) diff --git a/SUMMARY.md b/SUMMARY.md index a4d4d71..aa60eb6 100644 --- a/SUMMARY.md +++ b/SUMMARY.md @@ -36,8 +36,9 @@ * [5.5 Suchmaschinenoptimierung](/kapitel-5/55_suchmaschinenoptimierung.md) * [Kapitel 6](kapitel-6.md) * [6.1 VuFind-Tutorial](/kapitel-6/61_vufind-tutorial.md) - * [6.2 Installation von MarcEdit](/kapitel-6/62_installation-von-marcedit.md) - * [6.3 Harvesting mit MarcEdit](/kapitel-6/63_harvesting-mit-marcedit.md) + * [6.2 Daten im Format MARC21 indexieren](/kapitel-6/62_daten-im-format-marc21-indexieren.md) + * [6.3 Installation von MarcEdit](/kapitel-6/62_installation-von-marcedit.md) + * [6.4 Harvesting mit MarcEdit](/kapitel-6/63_harvesting-mit-marcedit.md) * [Kapitel 7](kapitel-7.md) * [Lerntagebücher](lerntagebucher.md) * [Lösungen](losungen.md) diff --git a/kapitel-6.md b/kapitel-6.md index a2d5a82..308c38b 100644 --- a/kapitel-6.md +++ b/kapitel-6.md @@ -5,5 +5,6 @@ Als Alternative zur manuellen Arbeit mit OpenRefine, Solr und TYPO3-find lernen Bitte nehmen Sie sich für die folgenden Abschnitte insgesamt etwa 8 Stunden Zeit: * [6.1 VuFind-Tutorial](/kapitel-6/61_vufind-tutorial.md) -* [6.2 Installation von MarcEdit](/kapitel-6/62_installation-von-marcedit.md) -* [6.3 Harvesting mit MarcEdit](/kapitel-6/63_harvesting-mit-marcedit.md) \ No newline at end of file +* [6.2 Daten im Format MARC21 indexieren](/kapitel-6/62_daten-im-format-marc21-indexieren.md) +* [6.3 Installation von MarcEdit](/kapitel-6/62_installation-von-marcedit.md) +* [6.4 Harvesting mit MarcEdit](/kapitel-6/63_harvesting-mit-marcedit.md) diff --git a/kapitel-6/62_daten-im-format-marc21-indexieren.md b/kapitel-6/62_daten-im-format-marc21-indexieren.md new file mode 100644 index 0000000..e62902e --- /dev/null +++ b/kapitel-6/62_daten-im-format-marc21-indexieren.md @@ -0,0 +1,24 @@ +# 6.2 Daten im Format MARC21 indexieren + +Wenn Sie mindestens das [Kapitel 3 "Installation von VuFind" des VuFind-Tutorials](https://felixlohmeier.gitbooks.io/vufind-tutorial-de/content/03_Installation_VuFind.html) bearbeitet haben, dann sollte Ihre VuFind-Installation bereit für den Import (weiterer) Daten sein. + +Wir laden für diesen Kurs Daten aus Schweizer Bibliotheks- und Archivbeständen. + +Direkt in VuFind lassen sich Daten in den Formaten MARC21 (binäres MARC, Dateiendung .mrc) und MARCXML (Dateiendung .marcxml) importieren. Für den Import von Daten in (anderen) XML-Formaten sind größere Anpassungen erforderlich. Wir laden daher in diesem Kapitel zunächst Daten im Format MARC21. + +## Rare Books der ETH-Bibliothek + +Die ETH-Bibliothek stellt im Rahmen Ihrer Open-Data-Initiative [Downloads ganzer Metadatensets](http://www.library.ethz.ch/en/ms/Open-Data-at-ETH-Library/Downloads), sogenannte "Bulk Data" zur Verfügung. Wir laden das Metadatenset "Rara" (Rare Books). + +1. Daten herunterladen + * `wget download.library.ethz.ch/opendata/eth_rar.marcxml.gz -O ~/Downloads/eth_rar.marcxml.gz` + * `gunzip ~/Downloads/eth_rar.marcxml.gz` +2. Solr starten (nur erforderlich wenn zwischenzeitlich neu gestartet wurde) + * `/usr/local/vufind/solr.sh start` +3. Import konfigurieren in Datei `/usr/local/vufind/import/marc_local.properties` + * `collection = Rare Books` + * `institution = ETH-Bibliothek` +4. Indexierung durchführen + * ` /usr/local/vufind/import-marc.sh ~/Downloads/eth_rar.marcxml` +5. Suchindex optimieren (optional) + * `php /usr/local/vufind/util/optimize.php` diff --git a/kapitel-6/62_installation-von-marcedit.md b/kapitel-6/63_installation-von-marcedit.md similarity index 98% rename from kapitel-6/62_installation-von-marcedit.md rename to kapitel-6/63_installation-von-marcedit.md index 97cc6eb..1204883 100644 --- a/kapitel-6/62_installation-von-marcedit.md +++ b/kapitel-6/63_installation-von-marcedit.md @@ -1,4 +1,4 @@ -# 6.2 Installation von MarcEdit +# 6.3 Installation von MarcEdit ## MarcEdit herunterladen diff --git a/kapitel-6/63_harvesting-mit-marcedit.md b/kapitel-6/64_harvesting-mit-marcedit.md similarity index 55% rename from kapitel-6/63_harvesting-mit-marcedit.md rename to kapitel-6/64_harvesting-mit-marcedit.md index 7b156a7..c2b7a13 100644 --- a/kapitel-6/63_harvesting-mit-marcedit.md +++ b/kapitel-6/64_harvesting-mit-marcedit.md @@ -1,31 +1,39 @@ -# 6.3 Harvesting mit MarcEdit +# 6.4 Harvesting mit MarcEdit ## Z39.50-Schnittstelle abfragen -* Auf das Zahnrad unten rechts auf der Startseite klicken und den Dialog mit OK bestätigen. Anschließend sollte das Tool Z39.50/SRU Client auf der Startseite von MarcEdit erscheinen. -* Tool Z39.50/SRU Client starten -* Schnittstelle des NEBIS-Verbunds ergänzen +1. Auf das Zahnrad unten rechts auf der Startseite klicken und den Dialog mit OK bestätigen. Anschließend sollte das Tool Z39.50/SRU Client auf der Startseite von MarcEdit erscheinen. +2. Tool `Z39.50/SRU Client` starten +3. Schnittstelle des NEBIS-Verbunds ergänzen * Modify Databases / Add Database / Import from Master List * aus der langen Liste NEBIS auswählen (ID: db270) -* Set Options +4. Set Options * Limit: 100 - * Save File: `einstein` im Ordner Downloads + * Save File: `einstein` im Ordner `Downloads` * Checkbox `Override local limits` aktivieren -* Search Mode +5. Search Mode * Search: `albert einstein` (Title) * Options: Select database anklicken und NEBIS auswählen * Download mit grünem Pfeil starten * Mehrfach ganz unten den Link "Get Next 100" anklicken, bis alle Records geladen sind * Rechtsklick auf einen Record und Option `Download All Records` wählen. -Die Daten sollten jetzt in einer Datei einstein.mrc im Ordner Downloads liegen. +Die Daten sollten jetzt in einer Datei `einstein.mrc` im Ordner `Downloads` liegen. ## Daten in VuFind indexieren -(folgt) +1. Solr starten (nur erforderlich wenn zwischenzeitlich neu gestartet wurde) + * `/usr/local/vufind/solr.sh start` +2. Import konfigurieren in Datei `/usr/local/vufind/import/marc_local.properties` + * `collection = Einstein` + * `institution = NEBIS` +3. Indexierung durchführen + * `/usr/local/vufind/import-marc.sh ~/Downloads/einstein.mrc` +4. Suchindex optimieren (optional) + * `php /usr/local/vufind/util/optimize.php` ## Literatur University Library, University of Illinois at Urbana-Champaign (Hrsg.): Querying Z39.50 Databases. In: LibGuide MarcEdit. An introduction to the MARC record editing software MarcEdit. Stand: 20.10.2017. -University Library, University of Illinois at Urbana-Champaign (Hrsg.): Harvest OAI Records. In: LibGuide MarcEdit. An introduction to the MARC record editing software MarcEdit. Stand: 20.10.2017. \ No newline at end of file +University Library, University of Illinois at Urbana-Champaign (Hrsg.): Harvest OAI Records. In: LibGuide MarcEdit. An introduction to the MARC record editing software MarcEdit. Stand: 20.10.2017.