Nachtrag Kapitel 10

This commit is contained in:
Felix Lohmeier 2017-02-23 23:12:37 +01:00
parent 516de707dd
commit 09b25fa584
4 changed files with 51 additions and 0 deletions

View File

@ -0,0 +1,12 @@
# 10 Exkurs zu Relevanzranking
Ziel: Möglichkeiten für die Sortierung der Trefferlisten in Bibliothekskatalogen kennenlernen und mit TYPO3-find testweise anwenden.
Inhalte:
1. [Referat zu Relevanzrankings](10_1_referat-zu-relevanzrankings.md)
2. [Relevanzranking mit TYPO3-find](10_2_relevanzranking-mit-typo3-find.md)
Beiträge der Studierenden in den Lerntagebüchern:
* ...

View File

@ -0,0 +1,15 @@
# 10.1 Referat zu Relevanzrankings
## Kernpunkte
Aus dem Referat von Dana Curic und Christian Dublasky am 19.12.2016 (vgl. [Präsentationsfolien](https://felixlohmeier.gitbooks.io/seminar-wir-bauen-uns-einen-bibliothekskatalog/content/slides/10_1_referat_zu_relevanzrankings.pdf)) und der anschließenden Diskussion:
* Relevanz ist abhängig vom Nutzungskontext, d.h. von der Person, die sucht und von ihrem Erkenntnisinteresse zum jeweiligen Zeitpunkt. Es ist daher nahezu unmöglich eine objektive Relevanz zu definieren.
* Discovery-Systeme versuchen eine subjektiv als "gut" empfundene Relevanzsortierung durch eine unterschiedliche Gewichtung der verschiedenen Metadatenfelder (Titel, UrheberIn, Beschreibungstext) herzustellen.
* Wenn die Daten uneinheitlich sind (z.B. zu einem Objekt viele und zu einem anderen Objekt sehr wenige beschreibende Daten enthalten sind), dann führt dies oft zu unerwarteten Rankings, weil der Suchindex in der Standardkonfiguration das Verhältnis der Suchtreffer in einem Dokument zur Gesamtlänge des Dokuments berechnet.
* Weil die Definition eines Algorithmus auf Basis von objektiven Kriterien so schwer fällt, wird in der Praxis die Gewichtung der Felder oft experimentell auf Basis von häufig durchgeführten Suchen austariert. Nutzerstudien sind beim Relevanzranking also besonders wichtig.
## Literatur
* Präsentation von Elmar Haake: Relevanzranking als Erfolgsfaktor für Discoverysysteme. http://docplayer.org/3530893-Relevanzranking-als-erfolgsfaktor-fuer-discoverysysteme-elmar-haake-staats-und-universitaetsbibliothek-bremen.html
* Hajo Seng: Relevance-Ranking auf dem VuFind-Anwendertreffen (siehe die dort verlinkten Papiere und Vortragsfolien). http://beluga-blog.sub.uni-hamburg.de/blog/2015/10/02/relevance-ranking-auf-dem-vufind-anwendertreffen-2015/

View File

@ -0,0 +1,24 @@
# 10.2 Relevanzranking mit TYPO3-find
TYPO3-find basiert auf dem Suchindex Solr, weshalb für das Relevanzranking die Konfigurationsmöglichkeiten von Solr genutzt werden können. Diese werden in der Datei ```solrconfig.xml``` definiert.
Die SUB Göttingen hat im Projekt Germania Sacra TYPO3-find für eine Klosterdatenbank eingesetzt. Der Quellcode steht auf GitHub. Hier der entsprechende Auszug aus der Konfiguration, in dem die Gewichtung der Felder zu erkennen ist:
```
<!-- Query settings -->
<str name="defType">edismax</str>
<str name="qf">
text^0.5 features^1.0 name^1.2 sku^1.5 id^10.0 manu^1.1 cat^1.4
title^10.0 description^5.0 keywords^5.0 author^2.0 resourcename^1.0
</str>
(...)
```
Treffer im Feld ```title``` (Titel) werden mit Faktor 10 am höchsten gewichtet, während Treffer im Feld ```text``` (Beschreibungstext) mit Faktor 0,5 relativ unwichtig für die Sortierung der Trefferliste sind.
Links:
* Klosterdatenbank Germania Sacra: http://klosterdatenbank.germania-sacra.de/
* solrconfig.xml von Germania Sacra: https://github.com/subugoe/germania-sacra-daten/blob/master/solr/conf/solrconfig.xml#L401
Aus Zeitgründen wurde das Thema Relevanzranking und die praktische Übung mit TYPO3-find im Seminar nicht weiter vertieft.

Binary file not shown.