diff --git a/10_0_exkurs-zu-relevanzranking.md b/10_0_exkurs-zu-relevanzranking.md new file mode 100644 index 0000000..3222efd --- /dev/null +++ b/10_0_exkurs-zu-relevanzranking.md @@ -0,0 +1,12 @@ +# 10 Exkurs zu Relevanzranking + +Ziel: Möglichkeiten für die Sortierung der Trefferlisten in Bibliothekskatalogen kennenlernen und mit TYPO3-find testweise anwenden. + +Inhalte: + +1. [Referat zu Relevanzrankings](10_1_referat-zu-relevanzrankings.md) +2. [Relevanzranking mit TYPO3-find](10_2_relevanzranking-mit-typo3-find.md) + +Beiträge der Studierenden in den Lerntagebüchern: + +* ... diff --git a/10_1_referat-zu-relevanzrankings.md b/10_1_referat-zu-relevanzrankings.md new file mode 100644 index 0000000..ff81db2 --- /dev/null +++ b/10_1_referat-zu-relevanzrankings.md @@ -0,0 +1,15 @@ +# 10.1 Referat zu Relevanzrankings + +## Kernpunkte + +Aus dem Referat von Dana Curic und Christian Dublasky am 19.12.2016 (vgl. [Präsentationsfolien](https://felixlohmeier.gitbooks.io/seminar-wir-bauen-uns-einen-bibliothekskatalog/content/slides/10_1_referat_zu_relevanzrankings.pdf)) und der anschließenden Diskussion: + +* Relevanz ist abhängig vom Nutzungskontext, d.h. von der Person, die sucht und von ihrem Erkenntnisinteresse zum jeweiligen Zeitpunkt. Es ist daher nahezu unmöglich eine objektive Relevanz zu definieren. +* Discovery-Systeme versuchen eine subjektiv als "gut" empfundene Relevanzsortierung durch eine unterschiedliche Gewichtung der verschiedenen Metadatenfelder (Titel, UrheberIn, Beschreibungstext) herzustellen. +* Wenn die Daten uneinheitlich sind (z.B. zu einem Objekt viele und zu einem anderen Objekt sehr wenige beschreibende Daten enthalten sind), dann führt dies oft zu unerwarteten Rankings, weil der Suchindex in der Standardkonfiguration das Verhältnis der Suchtreffer in einem Dokument zur Gesamtlänge des Dokuments berechnet. +* Weil die Definition eines Algorithmus auf Basis von objektiven Kriterien so schwer fällt, wird in der Praxis die Gewichtung der Felder oft experimentell auf Basis von häufig durchgeführten Suchen austariert. Nutzerstudien sind beim Relevanzranking also besonders wichtig. + +## Literatur + +* Präsentation von Elmar Haake: Relevanzranking als Erfolgsfaktor für Discoverysysteme. http://docplayer.org/3530893-Relevanzranking-als-erfolgsfaktor-fuer-discoverysysteme-elmar-haake-staats-und-universitaetsbibliothek-bremen.html +* Hajo Seng: Relevance-Ranking auf dem VuFind-Anwendertreffen (siehe die dort verlinkten Papiere und Vortragsfolien). http://beluga-blog.sub.uni-hamburg.de/blog/2015/10/02/relevance-ranking-auf-dem-vufind-anwendertreffen-2015/ diff --git a/10_2_relevanzranking-mit-typo3-find.md b/10_2_relevanzranking-mit-typo3-find.md new file mode 100644 index 0000000..2c81483 --- /dev/null +++ b/10_2_relevanzranking-mit-typo3-find.md @@ -0,0 +1,24 @@ +# 10.2 Relevanzranking mit TYPO3-find + +TYPO3-find basiert auf dem Suchindex Solr, weshalb für das Relevanzranking die Konfigurationsmöglichkeiten von Solr genutzt werden können. Diese werden in der Datei ```solrconfig.xml``` definiert. + +Die SUB Göttingen hat im Projekt Germania Sacra TYPO3-find für eine Klosterdatenbank eingesetzt. Der Quellcode steht auf GitHub. Hier der entsprechende Auszug aus der Konfiguration, in dem die Gewichtung der Felder zu erkennen ist: + +``` + +edismax + + text^0.5 features^1.0 name^1.2 sku^1.5 id^10.0 manu^1.1 cat^1.4 + title^10.0 description^5.0 keywords^5.0 author^2.0 resourcename^1.0 + +(...) +``` + +Treffer im Feld ```title``` (Titel) werden mit Faktor 10 am höchsten gewichtet, während Treffer im Feld ```text``` (Beschreibungstext) mit Faktor 0,5 relativ unwichtig für die Sortierung der Trefferliste sind. + +Links: + +* Klosterdatenbank Germania Sacra: http://klosterdatenbank.germania-sacra.de/ +* solrconfig.xml von Germania Sacra: https://github.com/subugoe/germania-sacra-daten/blob/master/solr/conf/solrconfig.xml#L401 + +Aus Zeitgründen wurde das Thema Relevanzranking und die praktische Übung mit TYPO3-find im Seminar nicht weiter vertieft. diff --git a/slides/10_1_referat_zu_relevanzrankings.pdf b/slides/10_1_referat_zu_relevanzrankings.pdf new file mode 100644 index 0000000..808c382 Binary files /dev/null and b/slides/10_1_referat_zu_relevanzrankings.pdf differ