2017-05-15 01:31:52 +02:00
|
|
|
# Vorverarbeitung mit MarcEdit und OpenRefine
|
|
|
|
|
|
|
|
## Beispieldaten von MARC21 in TSV konvertieren
|
|
|
|
|
|
|
|
vgl. Anleitung im vorigen Kapitel
|
|
|
|
|
|
|
|
## Daten in OpenRefine laden
|
|
|
|
|
|
|
|
* Menü Create Project
|
|
|
|
* TSV-Datei hochladen
|
|
|
|
* In den Optionen "store blank rows" deaktivieren
|
|
|
|
|
|
|
|
## Subfields aufteilen
|
|
|
|
|
|
|
|
Führen Sie folgende Transformationsschritte in OpenRefine durch:
|
|
|
|
|
|
|
|
* column Column / Edit column / Remove this column
|
|
|
|
* column Content / Text filter: $
|
2017-05-16 10:29:13 +02:00
|
|
|
* column Content / add column based on this column / Subfields / forEach\(value.split\("$"\),v,get\(v,0\)\).join\("$"\)
|
|
|
|
* column Content / edit cells / transform... / forEach\(value.split\("$"\),v,slice\(v,1\)\).join\("$"\)
|
2017-05-15 01:31:52 +02:00
|
|
|
* close text filter
|
|
|
|
* column Subfields / edit cells / split multi-valued cells... / $
|
|
|
|
* column Content / edit cells / split multi-valued cells... / $
|
|
|
|
|
|
|
|
## Records bilden
|
|
|
|
|
|
|
|
Führen Sie folgende Transformationsschritte in OpenRefine durch:
|
|
|
|
|
2017-05-16 10:29:13 +02:00
|
|
|
* column Subfields / Facet / customized facets / Facet by blank / false
|
|
|
|
* column RecordNumber / edit cells / Fill down
|
|
|
|
* column Tags / edit cells / Fill down
|
|
|
|
* column Indicators / edit cells / Fill down
|
|
|
|
* close facet
|
|
|
|
* column RecordNumber / edit cells / Blank down
|
|
|
|
* Show: 5 rows
|
|
|
|
* Show as: records
|
|
|
|
|
2017-05-16 11:12:02 +02:00
|
|
|
## Optional: Transformationsschritte als JSON-Konfiguration
|
|
|
|
|
|
|
|
* Alle Transformationsschritte oben als JSON-Konfiguration: [openrefine/marc.json](/openrefine/marc.json)
|
|
|
|
* In der Summerschool erarbeitete Alternativlösung: [openrefine/marc\_alternativ.json](/openrefine/marc_alternativ.json)
|
|
|
|
|
2017-05-16 10:29:13 +02:00
|
|
|
|
|
|
|
|