Update 07_1_facetten_und_text_filter.md

This commit is contained in:
Felix Lohmeier 2016-11-06 22:03:39 +01:00
parent 8ba591488c
commit 5f6655d729
1 changed files with 11 additions and 1 deletions

View File

@ -1,3 +1,13 @@
# 7.1 Facetten und Text Filter
Literatur: https://github.com/OpenRefine/OpenRefine/wiki/Faceting
Alle folgenden Übungen in den Kapiteln 7.1 bis 7.3 führen wir zunächst mit einer Datei aus dem Download durch. Wir arbeiten also zunächst beispielhaft mit nur 100 Datensätzen. In Kapitel 7.4 wenden wir dann die gelernten Transformationen auf alle 450.000 Datensätze an.
OpenRefine "versteht" das MARC-Format nicht. Es interpretiert die Daten daher genauso wie jede andere XML-Datei. In den Daten stehen daher die üblichen Nummern und Codes für die jeweiligen MARC-Felder. Der GBV bietet meines Wissens nach keine Beschreibung der Feldbelegungen an. Zur Orientierung können Sie die [Arbeitstabelle der Deutschen Nationalbibliothek](http://www.dnb.de/SharedDocs/Downloads/DE/DNB/standardisierung/marc21FeldbeschreibungTitelExcel032016.zip) in der [Dokumentation des MARC21-Formats](http://www.dnb.de/DE/Standardisierung/Formate/MARC21/marc21_node.html) verwenden.
## Aufgabe: Analysieren Sie die Daten mit Hilfe von Facetten und Text Filtern
siehe [Seite zur Facettierung in der Dokumentation von OpenRefine](https://github.com/OpenRefine/OpenRefine/wiki/Faceting)
## Bonusaufgabe: Laden Sie die Arbeitstabelle der DNB in OpenRefine
[Arbeitstabelle der Deutschen Nationalbibliothek](http://www.dnb.de/SharedDocs/Downloads/DE/DNB/standardisierung/marc21FeldbeschreibungTitelExcel032016.zip)