Korrekturen Kapitel 10

This commit is contained in:
Felix Lohmeier 2017-02-23 23:19:47 +01:00
parent 09b25fa584
commit e9f507e58d
2 changed files with 3 additions and 3 deletions

View File

@ -6,7 +6,7 @@ Aus dem Referat von Dana Curic und Christian Dublasky am 19.12.2016 (vgl. [Präs
* Relevanz ist abhängig vom Nutzungskontext, d.h. von der Person, die sucht und von ihrem Erkenntnisinteresse zum jeweiligen Zeitpunkt. Es ist daher nahezu unmöglich eine objektive Relevanz zu definieren.
* Discovery-Systeme versuchen eine subjektiv als "gut" empfundene Relevanzsortierung durch eine unterschiedliche Gewichtung der verschiedenen Metadatenfelder (Titel, UrheberIn, Beschreibungstext) herzustellen.
* Wenn die Daten uneinheitlich sind (z.B. zu einem Objekt viele und zu einem anderen Objekt sehr wenige beschreibende Daten enthalten sind), dann führt dies oft zu unerwarteten Rankings, weil der Suchindex in der Standardkonfiguration das Verhältnis der Suchtreffer in einem Dokument zur Gesamtlänge des Dokuments berechnet.
* Wenn die Daten uneinheitlich sind (z.B. wenn zu einem Objekt viele und zu einem anderen Objekt sehr wenige beschreibende Daten vorliegen), dann führt dies oft zu unerwarteten Rankings, weil der Suchindex in der Standardkonfiguration das Verhältnis der Suchtreffer in einem Dokument zur Gesamtlänge des Dokuments in die Berechnung der Relevanzsortierung einfließen lässt.
* Weil die Definition eines Algorithmus auf Basis von objektiven Kriterien so schwer fällt, wird in der Praxis die Gewichtung der Felder oft experimentell auf Basis von häufig durchgeführten Suchen austariert. Nutzerstudien sind beim Relevanzranking also besonders wichtig.
## Literatur

View File

@ -14,11 +14,11 @@ Die SUB Göttingen hat im Projekt Germania Sacra TYPO3-find für eine Klosterdat
(...)
```
Treffer im Feld ```title``` (Titel) werden mit Faktor 10 am höchsten gewichtet, während Treffer im Feld ```text``` (Beschreibungstext) mit Faktor 0,5 relativ unwichtig für die Sortierung der Trefferliste sind.
Treffer im Feld ```title``` (Titel) werden mit Faktor 10 am höchsten gewichtet, während Treffer im Feld ```text``` (Beschreibungstext) mit Faktor 0,5 relativ unwichtig für die Sortierung der Trefferliste sind. Das Beispiel zeigt, dass eine Verbesserung der Relevanzsortierung von Trefferlisten in der Praxis bereits durch eine einfache Gewichtung der Felder erzielt werden kann.
Links:
* Klosterdatenbank Germania Sacra: http://klosterdatenbank.germania-sacra.de/
* solrconfig.xml von Germania Sacra: https://github.com/subugoe/germania-sacra-daten/blob/master/solr/conf/solrconfig.xml#L401
Aus Zeitgründen wurde das Thema Relevanzranking und die praktische Übung mit TYPO3-find im Seminar nicht weiter vertieft.
Aus Zeitgründen musste die praktische Übung mit TYPO3-find leider entfallen.