neuer task für diff der beiden letzten ZIP-Archive
This commit is contained in:
parent
8151d16cd2
commit
4ef4c30c06
|
@ -12,6 +12,7 @@ tasks:
|
||||||
- task: split
|
- task: split
|
||||||
- task: validate
|
- task: validate
|
||||||
- task: zip
|
- task: zip
|
||||||
|
- task: diff
|
||||||
|
|
||||||
harvest:
|
harvest:
|
||||||
desc: nur harvesten
|
desc: nur harvesten
|
||||||
|
@ -85,7 +86,7 @@ tasks:
|
||||||
dir: data/siegen/refine
|
dir: data/siegen/refine
|
||||||
cmds:
|
cmds:
|
||||||
# Logdatei von OpenRefine auf Warnungen und Fehlermeldungen prüfen
|
# Logdatei von OpenRefine auf Warnungen und Fehlermeldungen prüfen
|
||||||
- if grep -i 'exception\|error' openrefine.log; then echo 1>&2 "log contains warnings!" && exit 1; fi
|
- if grep -i 'exception\|error' openrefine.log; then echo 1>&2 "Logdatei $PWD/openrefine.log enthält Warnungen!" && exit 1; fi
|
||||||
|
|
||||||
split:
|
split:
|
||||||
dir: data/siegen/split
|
dir: data/siegen/split
|
||||||
|
@ -102,7 +103,7 @@ tasks:
|
||||||
- ./*.xml
|
- ./*.xml
|
||||||
|
|
||||||
validate:
|
validate:
|
||||||
dir: data/siegen/
|
dir: data/siegen
|
||||||
cmds:
|
cmds:
|
||||||
# Validierung gegen METS Schema
|
# Validierung gegen METS Schema
|
||||||
- wget -q -nc https://www.loc.gov/standards/mets/mets.xsd
|
- wget -q -nc https://www.loc.gov/standards/mets/mets.xsd
|
||||||
|
@ -113,7 +114,7 @@ tasks:
|
||||||
- validate.log
|
- validate.log
|
||||||
|
|
||||||
zip:
|
zip:
|
||||||
dir: data/siegen/
|
dir: data/siegen
|
||||||
cmds:
|
cmds:
|
||||||
# ZIP-Archiv mit Zeitstempel erstellen
|
# ZIP-Archiv mit Zeitstempel erstellen
|
||||||
- zip -q -FS -j siegen_{{.DATE}}.zip split/*.xml
|
- zip -q -FS -j siegen_{{.DATE}}.zip split/*.xml
|
||||||
|
@ -122,6 +123,24 @@ tasks:
|
||||||
generates:
|
generates:
|
||||||
- siegen_{{.DATE}}.zip
|
- siegen_{{.DATE}}.zip
|
||||||
|
|
||||||
|
diff:
|
||||||
|
dir: data/siegen
|
||||||
|
cmds:
|
||||||
|
# Inhalt der beiden letzten ZIP-Archive vergleichen
|
||||||
|
- unzip -q -d old $(ls -t *.zip | sed -n 2p)
|
||||||
|
- unzip -q -d new $(ls -t *.zip | sed -n 1p)
|
||||||
|
- diff -d old new > diff.log || exit 0
|
||||||
|
- rm -rf old new
|
||||||
|
# Diff prüfen, ob es weniger als 500 Zeilen enthält
|
||||||
|
- if (( 500 < $(wc -l <diff.log) )); then echo 1>&2 "Unerwartet große Änderungen in $PWD/diff.log!" && exit 1; fi
|
||||||
|
sources:
|
||||||
|
- split/*.xml
|
||||||
|
generates:
|
||||||
|
- diff.log
|
||||||
|
status:
|
||||||
|
# Task nicht ausführen, wenn weniger als zwei ZIP-Archive vorhanden
|
||||||
|
- test -z $(ls -t *.zip | sed -n 2p)
|
||||||
|
|
||||||
delete:
|
delete:
|
||||||
desc: cache löschen
|
desc: cache löschen
|
||||||
cmds:
|
cmds:
|
||||||
|
|
|
@ -12,6 +12,7 @@ tasks:
|
||||||
- task: split
|
- task: split
|
||||||
- task: validate
|
- task: validate
|
||||||
- task: zip
|
- task: zip
|
||||||
|
- task: diff
|
||||||
|
|
||||||
harvest:
|
harvest:
|
||||||
desc: nur harvesten
|
desc: nur harvesten
|
||||||
|
@ -87,7 +88,7 @@ tasks:
|
||||||
dir: data/wuppertal/refine
|
dir: data/wuppertal/refine
|
||||||
cmds:
|
cmds:
|
||||||
# Logdatei von OpenRefine auf Warnungen und Fehlermeldungen prüfen
|
# Logdatei von OpenRefine auf Warnungen und Fehlermeldungen prüfen
|
||||||
- if grep -i 'exception\|error' openrefine.log; then echo 1>&2 "log contains warnings!" && exit 1; fi
|
- if grep -i 'exception\|error' openrefine.log; then echo 1>&2 "Logdatei $PWD/openrefine.log enthält Warnungen!" && exit 1; fi
|
||||||
|
|
||||||
split:
|
split:
|
||||||
dir: data/wuppertal/split
|
dir: data/wuppertal/split
|
||||||
|
@ -104,7 +105,7 @@ tasks:
|
||||||
- ./*.xml
|
- ./*.xml
|
||||||
|
|
||||||
validate:
|
validate:
|
||||||
dir: data/wuppertal/
|
dir: data/wuppertal
|
||||||
cmds:
|
cmds:
|
||||||
# Validierung gegen METS Schema
|
# Validierung gegen METS Schema
|
||||||
- wget -q -nc https://www.loc.gov/standards/mets/mets.xsd
|
- wget -q -nc https://www.loc.gov/standards/mets/mets.xsd
|
||||||
|
@ -115,7 +116,7 @@ tasks:
|
||||||
- validate.log
|
- validate.log
|
||||||
|
|
||||||
zip:
|
zip:
|
||||||
dir: data/wuppertal/
|
dir: data/wuppertal
|
||||||
cmds:
|
cmds:
|
||||||
# ZIP-Archiv mit Zeitstempel erstellen
|
# ZIP-Archiv mit Zeitstempel erstellen
|
||||||
- zip -q -FS -j wuppertal_{{.DATE}}.zip split/*.xml
|
- zip -q -FS -j wuppertal_{{.DATE}}.zip split/*.xml
|
||||||
|
@ -124,6 +125,24 @@ tasks:
|
||||||
generates:
|
generates:
|
||||||
- wuppertal_{{.DATE}}.zip
|
- wuppertal_{{.DATE}}.zip
|
||||||
|
|
||||||
|
diff:
|
||||||
|
dir: data/wuppertal
|
||||||
|
cmds:
|
||||||
|
# Inhalt der beiden letzten ZIP-Archive vergleichen
|
||||||
|
- unzip -q -d old $(ls -t *.zip | sed -n 2p)
|
||||||
|
- unzip -q -d new $(ls -t *.zip | sed -n 1p)
|
||||||
|
- diff -d old new > diff.log || exit 0
|
||||||
|
- rm -rf old new
|
||||||
|
# Diff prüfen, ob es weniger als 500 Zeilen enthält
|
||||||
|
- if (( 500 < $(wc -l <diff.log) )); then echo 1>&2 "Unerwartet große Änderungen in $PWD/diff.log!" && exit 1; fi
|
||||||
|
sources:
|
||||||
|
- split/*.xml
|
||||||
|
generates:
|
||||||
|
- diff.log
|
||||||
|
status:
|
||||||
|
# Task nicht ausführen, wenn weniger als zwei ZIP-Archive vorhanden
|
||||||
|
- test -z $(ls -t *.zip | sed -n 2p)
|
||||||
|
|
||||||
delete:
|
delete:
|
||||||
desc: cache löschen
|
desc: cache löschen
|
||||||
cmds:
|
cmds:
|
||||||
|
|
Loading…
Reference in New Issue