bibliotheks-und-archivinfor.../06_suchmaschinen-und-discov...

5.7 KiB

Suchmaschinen und Discovery-Systeme

  • Installation und Konfiguration von VuFind
  • Funktion von Suchmaschinen am Beispiel von Solr
  • Übung zur Datenintegration
  • Marktüberblick Discovery-Systeme
  • Zwischenfazit

Installation und Konfiguration von VuFind

Installation VuFind 8.0.2

Konfiguration Suche und Facetten

Funktion von Suchmaschinen am Beispiel von Solr

  • Zur Einordnung von Solr
  • Sichtung von Solr in VuFind

Zur Einordnung von Solr

  • Solr ist zusammen mit Elasticsearch quasi "Industriestandard".
  • Üblicherweise sollte vor dem Import der Daten in einem Schema festgelegt werden welche Felder existieren und welche Datentypen diese beinhalten dürfen.
  • Solr hat zwar eine integrierte Suchoberfläche, aber diese ist nur zu Demo-Zwecken gedacht.
  • Das Discovery-System VuFind basiert auf Solr (ebenso wie viele kommerzielle Lösungen wie z.B. Ex Libris Primo).

Suchindex (Solr) oder Datenbank (MySQL)?

Solr MySQL
flache Dokumente relationale Datensätze
lexikalische Suche reiner Glyphenvergleich
keine Konsistenzprüfung Transaktionssicherheit
statische Daten veränderliche Daten
-> Retrieval (Suche) -> Storage (CRUD)
  • CRUD: Create, Read, Update, Delete

Sichtung von Solr in VuFind

Note:

  • Ggf. müssen Sie Solr neustarten, falls Sie zwischenzeitlich Ihre VM neu gebootet haben:
/usr/local/vufind/solr.sh start

Übung: Suche in VuFind vs. Suche in Solr

  • Suchen in VuFind: http://localhost/vufind
    • Beispielsweise nach psychology
  • Suchen in Admin-Oberfläche von Solr: http://localhost:8983/solr/#/biblio/query
    • im Feld q mit Feldname:Suchbegriff. Beispiel: allfields:psychology
    • unten links Button "Execute Query"
  • Parallel Logdatei von Solr anschauen in einem Terminal
    less +F /usr/local/vufind/solr/vufind/logs/solr.log
    
  • Notieren Sie Unterschiede und Auffälligkeiten im gemeinsamen Dokument

Note:

  • Das Programm less kann bei Bedarf im Terminal beendet werden mit der Tastenkombination STRG + C (für interrupt) und dann der Taste q (für quit).

Literatur zu Solr

Übung zur Datenintegration

Ziel: Import der mit MarcEdit und OpenRefine konvertierten Daten aus Koha, ArchivesSpace, DSpace und DOAJ in VuFind

Testdaten löschen

Quelle: https://vufind.org/wiki/indexing:re-indexing

/usr/local/vufind/solr.sh stop
rm -rf /usr/local/vufind/solr/vufind/biblio/index /usr/local/vufind/solr/vufind/biblio/spell*
/usr/local/vufind/solr.sh start

Aufgabe für die Gruppenarbeit

  • Importieren Sie alle in MARCXML konvertierten Daten. Gehen Sie dabei wie folgt vor:
    1. Laden und entpacken Sie die Beispieldaten. Gerne können Sie zusätzlich Ihre selbst in MARCXML konvertierten Daten verwenden.
      • Wenn Sie nach Klick auf den Downloadlink das Programm "Archive Manager" auswählen, können Sie die enthaltenen Verzeichnisse und Dateien bequem über den Button "Extract" in ein beliebiges Verzeichnis speichern.
      • Wir gehen im Folgenden vom Verzeichnis Downloads aus.
    2. Bearbeiten Sie vor dem Import die Datei marc_local.properties um den Daten eine "collection" zuzuweisen.
      gedit /usr/local/vufind/import/marc_local.properties
      
    3. Starten Sie das Importscript für die erste Datenquelle. Beispiel für Koha:
      for f in ~/Downloads/koha/*.xml; do /usr/local/vufind/import-marc.sh $f; done
      
    4. Wiederholen Sie die Schritte 2 und 3 für die übrigen Datenquellen.
  • Achtung: Der Import der Beispieldaten von ArchivesSpace und DSpace schlägt fehl. Finden Sie die Ursache.
  • Fügen Sie am Ende der Übung einen Screenshot der Trefferliste einer "leeren" Suche in das gemeinsame Dokument ein.

Note:

  • Die Beispieldaten umfassen die in den vergangenen Lehreinheiten mit MarcEdit und OpenRefine prozessierten Daten sowie den Export aus Koha. Wir stellen Sie hier bereit, damit Sie einheitliche Daten zur Verfügung haben auch wenn bei den vorherigen Aufgaben etwas durcheinandergekommen ist.

Zwischenfazit

Schaubild zu Lehrinhalten

Aufgaben

Bis zum nächsten Termin:

  1. Beitrag im Lerntagebuch zu dieser Lehreinheit
  2. Lehrevaluation