OpenRefine-Projekt für Debugging archivieren #11
This commit is contained in:
parent
16cd539131
commit
391fef2137
|
@ -64,21 +64,24 @@ tasks:
|
||||||
$OPENREFINE_CLIENT -P $PORT --export --template "$(< ../../../rules/siegen/template.txt)" --rowSeparator "
|
$OPENREFINE_CLIENT -P $PORT --export --template "$(< ../../../rules/siegen/template.txt)" --rowSeparator "
|
||||||
<!-- SPLIT -->
|
<!-- SPLIT -->
|
||||||
" --output siegen.txt $PROJECT
|
" --output siegen.txt $PROJECT
|
||||||
# Export für Debugging
|
# Statistik zu Laufzeit und Ressourcenverbrauch
|
||||||
- $OPENREFINE_CLIENT -P $PORT --export --output siegen-debug.tsv $PROJECT
|
- ps -o start,etime,%mem,%cpu,rss -p $(lsof -t -i:$PORT)
|
||||||
# OpenRefine beenden
|
# OpenRefine beenden
|
||||||
- ps -o start,etime,%mem,%cpu,rss -p $(lsof -t -i:$PORT) # Statistik
|
- PID=$(lsof -t -i:$PORT); kill $PID; while ps -p $PID > /dev/null; do sleep 1; done
|
||||||
- kill -9 $(lsof -t -i:$PORT) # SIGKILL (-9) verhindert unnötigen Speichervorgang
|
# OpenRefine-Projekt für Debugging archivieren
|
||||||
- rm -rf ./*.project* && rm -f workspace.json # temporäre Dateien von OpenRefine löschen
|
- tar cfz siegen.openrefine.tar.gz -C $(grep -l siegen *.project/metadata.json | cut -d '/' -f 1) .
|
||||||
|
# Temporäre Dateien löschen
|
||||||
|
- rm -rf ./*.project* && rm -f workspace.json
|
||||||
sources:
|
sources:
|
||||||
# wenn "dir:" für task gesetzt ist, dann relative Links ausgehend von dir
|
# wenn "dir:" für task gesetzt ist, dann relative Links ausgehend von dir
|
||||||
- ../harvest/siegen.xml
|
- ../harvest/siegen.xml
|
||||||
- ../../../rules/siegen/*.json
|
- ../../../rules/siegen/*.json
|
||||||
- ../../../rules/siegen/template.txt
|
- ../../../rules/siegen/template.txt
|
||||||
# - ../../../rules/common/*.json
|
#TODO - ../../../rules/common/*.json
|
||||||
generates:
|
generates:
|
||||||
|
- openrefine.log
|
||||||
- siegen.txt
|
- siegen.txt
|
||||||
- siegen-debug.tsv
|
- siegen.openrefine.tar.gz
|
||||||
|
|
||||||
check:
|
check:
|
||||||
cmds:
|
cmds:
|
||||||
|
|
|
@ -67,21 +67,24 @@ tasks:
|
||||||
$OPENREFINE_CLIENT -P $PORT --export --template "$(< ../../../rules/wuppertal/template.txt)" --rowSeparator "
|
$OPENREFINE_CLIENT -P $PORT --export --template "$(< ../../../rules/wuppertal/template.txt)" --rowSeparator "
|
||||||
<!-- SPLIT -->
|
<!-- SPLIT -->
|
||||||
" --output wuppertal.txt $PROJECT
|
" --output wuppertal.txt $PROJECT
|
||||||
# Export für Debugging
|
# Statistik zu Laufzeit und Ressourcenverbrauch
|
||||||
- $OPENREFINE_CLIENT -P $PORT --export --output wuppertal-debug.tsv $PROJECT
|
- ps -o start,etime,%mem,%cpu,rss -p $(lsof -t -i:$PORT)
|
||||||
# OpenRefine beenden
|
# OpenRefine beenden
|
||||||
- ps -o start,etime,%mem,%cpu,rss -p $(lsof -t -i:$PORT) # Statistik
|
- PID=$(lsof -t -i:$PORT); kill $PID; while ps -p $PID > /dev/null; do sleep 1; done
|
||||||
- kill -9 $(lsof -t -i:$PORT) # SIGKILL (-9) verhindert unnötigen Speichervorgang
|
# OpenRefine-Projekt für Debugging archivieren
|
||||||
- rm -rf ./*.project* && rm -f workspace.json # temporäre Dateien von OpenRefine löschen
|
- tar cfz wuppertal.openrefine.tar.gz -C $(grep -l wuppertal *.project/metadata.json | cut -d '/' -f 1) .
|
||||||
|
# Temporäre Dateien löschen
|
||||||
|
- rm -rf ./*.project* && rm -f workspace.json
|
||||||
sources:
|
sources:
|
||||||
# wenn "dir:" für task gesetzt ist, dann relative Links ausgehend von dir
|
# wenn "dir:" für task gesetzt ist, dann relative Links ausgehend von dir
|
||||||
- ../harvest/wuppertal.xml
|
- ../harvest/wuppertal.xml
|
||||||
- ../../../rules/wuppertal/*.json
|
- ../../../rules/wuppertal/*.json
|
||||||
- ../../../rules/wuppertal/template.txt
|
- ../../../rules/wuppertal/template.txt
|
||||||
# - ../../../rules/common/*.json
|
#TODO - ../../../rules/common/*.json
|
||||||
generates:
|
generates:
|
||||||
|
- openrefine.log
|
||||||
- wuppertal.txt
|
- wuppertal.txt
|
||||||
- wuppertal-debug.tsv
|
- wuppertal.openrefine.tar.gz
|
||||||
|
|
||||||
check:
|
check:
|
||||||
cmds:
|
cmds:
|
||||||
|
@ -91,14 +94,13 @@ tasks:
|
||||||
sources:
|
sources:
|
||||||
# wenn "dir:" für task nicht gesetzt ist, dann relative Links ausgehend von Taskfile.yml
|
# wenn "dir:" für task nicht gesetzt ist, dann relative Links ausgehend von Taskfile.yml
|
||||||
- data/wuppertal/refine/openrefine.log
|
- data/wuppertal/refine/openrefine.log
|
||||||
- data/wuppertal/refine/siegen.txt
|
- data/wuppertal/refine/wuppertal.txt
|
||||||
|
|
||||||
split:
|
split:
|
||||||
cmds:
|
cmds:
|
||||||
- task: :split
|
- task: :split
|
||||||
vars: {PROJECT: "wuppertal"}
|
vars: {PROJECT: "wuppertal"}
|
||||||
sources:
|
sources:
|
||||||
# wenn "dir:" für task nicht gesetzt ist, dann relative Links ausgehend von Taskfile.yml
|
|
||||||
- data/wuppertal/refine/wuppertal.txt
|
- data/wuppertal/refine/wuppertal.txt
|
||||||
generates:
|
generates:
|
||||||
- data/wuppertal/split/*.xml
|
- data/wuppertal/split/*.xml
|
||||||
|
|
Loading…
Reference in New Issue