Update 06_2_installation_openrefine.md

This commit is contained in:
Felix Lohmeier 2016-10-31 10:35:19 +01:00
parent d354c11dba
commit dc295ecb93
1 changed files with 37 additions and 0 deletions

View File

@ -1,2 +1,39 @@
# 6.2 Installation OpenRefine # 6.2 Installation OpenRefine
## Container aus Docker Hub laden
Docker bietet eine zentrale Plattform an, auf der Container zur Nachnutzung abgelegt weden können (vergleichbar mit einem App-Store). Wir nutzen das folgende Repository auf Docker Hub:
https://hub.docker.com/r/felixlohmeier/openrefine/
## Laden und Starten von OpenRefine
Einer der Vorteile von Docker ist, dass mit einem einzigen Befehl der Download und das Starten von Containern aus dem Docker Hub ermöglicht wird:
```
sudo docker run --rm -p 8888:3333 felixlohmeier/openrefine:2.6rc2
```
Erläuterungen:
* Da der Container noch nicht lokal vorliegt, wird er automatisch von Docker Hub heruntergeladen (in Teilbestandteilen)
* ```felixlohmeier/openrefine:2.6rc2``` ist die Kennzeichnung des Images im Docker Hub
* ```--rm``` löscht den Container nach dem Beenden wieder, damit die Festplatte nicht zumüllt
* ```-p 8888:3333``` richtet ein sogenanntes Port Forwarding im Netzwerk ein. Port 8888 außen wird auf Port 3333 innen gemappt. Somit ist der Docker-Container über http://<ip-adresse>:8888 von außen erreichbar
* Bei dieser Variante werden Daten innerhalb des Containers gespeichert. Da wir das Kommando ```--rm``` verwenden, werden die Daten nach Beenden ebenfalls gelöscht.
* Beenden von Docker im Terminal mit ```STRG+C```
## Laden und Starten von OpenRefine mit lokalem Arbeitsverzeichnis
1. Ordner im Homeverzeichnis erstellen:
```mkdir refine```
2. Docker starten mit zusätzlichen Parametern:
```
sudo docker run --rm -p 8888:3333 -v /home/stud/refine:/data felixlohmeier/openrefine:2.6rc2 -i 0.0.0.0 -m 3G -d /data
```
Erläuterungen:
* ```-v /home/stud/refine:/data``` definiert das lokale Arbeitsverzeichnis.
* ```stud``` durch eigenen Benutzernamen ersetzen
* ```-i 0.0.0.0``` öffnet den Docker-Container für den Zugriff aus dem Netzwerk
* ```-m 3G``` erlaubt dem Docker-Container bis zu 3 GB Arbeitsspeicher zu verwenden
* ```-d /data``` definiert das Arbeitsterzeichnis im Docker-Container