You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Felix Lohmeier 9bad6aeb17 refactoring mit openrefine-task runner 10 hours ago
alephino refactoring mit openrefine-task runner 10 hours ago
barcodes refactoring mit openrefine-task runner 10 hours ago
bibliotheca refactoring mit openrefine-task runner 10 hours ago
pica+ refactoring mit openrefine-task runner 10 hours ago
.gitignore refactoring mit openrefine-task runner 10 hours ago
LICENSE Initial commit 7 months ago
README.md refactoring mit openrefine-task runner 10 hours ago
Taskfile.yml refactoring mit openrefine-task runner 10 hours ago

README.md

Transformation von Bibliotheca und Alephino nach PICA+ für die Bibliotheken der Berufsakademie Sachsen

Vorbereitung

  1. Exporte bereitstellen mit folgenden Dateinamen:

    • alephino/input/leipzig-exemplare.txt
    • alephino/input/leipzig-titel.txt
    • alephino/input/riesa-exemplare.txt
    • alephino/input/riesa-titel.txt
    • bibliotheca/input/bautzen.imp
    • bibliotheca/input/breitenbrunn.imp
    • bibliotheca/input/dresden.imp
    • bibliotheca/input/glauchau.imp
    • bibliotheca/input/plauen.imp
  2. Installation Task 3.2.2

    a) RPM-based (Fedora, CentOS, SLES, etc.)

    wget https://github.com/go-task/task/releases/download/v3.2.2/task_linux_amd64.rpm
    sudo dnf install ./task_linux_amd64.rpm && rm task_linux_amd64.rpm
    

    b) DEB-based (Debian, Ubuntu etc.)

    wget https://github.com/go-task/task/releases/download/v3.2.2/task_linux_amd64.deb
    sudo apt install ./task_linux_amd64.deb && rm task_linux_amd64.deb
    
  3. Installation OpenRefine 3.4.1 und openrefine-client 0.3.10

    task install
    

Nutzung

Datenverarbeitung sequentiell

task default

Datenverarbeitung (teil)parallelisiert (benötigt bis zu 16 GB RAM)

task pica+:main

Analyse dubletter Barcodes

task barcodes:main

Systemvoraussetzungen

  • GNU/Linux (getestet auf Fedora 32)
  • JAVA 8+ (für OpenReifne)
  • 8 GB freien Arbeitsspeicher

Verwendete Tools