seminar-wir-bauen-uns-einen.../07_1_facetten_und_text_filt...

1.3 KiB

7.1 Facetten und Text Filter

Alle folgenden Übungen in den Kapiteln 7.1 bis 7.3 führen wir zunächst mit einer einzigen Datei aus dem Download durch. Diese Datei beinhaltet "nur" 100 Datensätze, mit denen wir beispielhaft arbeiten. In Kapitel 7.4 werden wir dann die gelernten Transformationen auf alle 450.000 Datensätze anwenden.

OpenRefine "versteht" das MARC-Format nicht. Es interpretiert die Daten daher genauso wie jede andere XML-Datei. In den Daten stehen daher die üblichen Nummern und Codes für die jeweiligen MARC-Felder. Der GBV bietet meines Wissens nach keine Beschreibung der Feldbelegungen an. Zur Orientierung können Sie die Arbeitstabelle der Deutschen Nationalbibliothek in der Dokumentation des MARC21-Formats verwenden.

Aufgabe 1: Analysieren Sie die Daten mit Hilfe von Facetten und Text Filtern

siehe Seite zur Facettierung in der Dokumentation von OpenRefine

Aufgabe 2: Laden Sie die Arbeitstabelle der DNB in OpenRefine

Arbeitstabelle der Deutschen Nationalbibliothek