Nachträge zu Kapitel 6 und ein Zwischenfazit

This commit is contained in:
Felix Lohmeier 2016-11-18 22:39:03 +01:00
parent a1933a76e1
commit 0488c40a87
5 changed files with 58 additions and 7 deletions

View File

@ -17,4 +17,4 @@ Literatur:
Die Installation von Docker auf der in Kapitel 3.1 eingerichteten VM gestaltet sich einfach. Es kann der normalen Installationsanleitung für Debian Server gefolgt werden:
https://docs.docker.com/engine/installation/linux/debian/
Test: ```sudo docker run hello-world```
Test: ```sudo docker run hello-world```

View File

@ -10,7 +10,7 @@ https://hub.docker.com/r/felixlohmeier/openrefine/
Einer der Vorteile von Docker ist, dass mit einem einzigen Befehl der Download und das Starten von Containern aus dem Docker Hub ermöglicht wird:
```
sudo docker run --rm -p 8888:3333 felixlohmeier/openrefine:2.6rc1
sudo docker run --rm -p 8888:3333 felixlohmeier/openrefine:2.6rc2
```
Anschließend im Browser (z.B. Firefox) auf dem lokalen Rechner OpenRefine aufrufen. OpenRefine ist unter der IP-Adresse des Webservers, gefolgt von Port 8888 erreichbar (Beispiel: https://192.168.1.1:8888).
@ -20,7 +20,7 @@ Erläuterungen:
* ```felixlohmeier/openrefine:2.6rc2``` ist die Kennzeichnung des Images im Docker Hub
* ```--rm``` löscht den Container nach dem Beenden wieder, damit die Festplatte nicht zumüllt
* ```-p 8888:3333``` richtet ein sogenanntes Port Forwarding im Netzwerk ein. Port 8888 außen wird auf Port 3333 innen gemappt. Somit ist der Docker-Container über http://<ip-adresse>:8888 von außen erreichbar
* Bei dieser Variante werden Daten innerhalb des Containers gespeichert. Da wir das Kommando ```--rm``` verwenden, werden die Daten nach Beenden ebenfalls gelöscht.
* Bei dieser Variante werden Daten innerhalb des Containers gespeichert. Da wir das Kommando ```--rm``` verwenden, **werden die Daten nach Beenden ebenfalls gelöscht**. Wählen Sie daher zukünftig immer die untenstehende erweiterte Variante mit lokalem Arbeitsverzeichnis!
* Beenden von Docker im Terminal mit ```STRG+C```
## Laden und Starten von OpenRefine mit lokalem Arbeitsverzeichnis
@ -30,7 +30,7 @@ Erläuterungen:
2. Docker starten mit zusätzlichen Parametern:
```
sudo docker run --rm -p 8888:3333 -v /home/stud/refine:/data felixlohmeier/openrefine:2.6rc1 -i 0.0.0.0 -m 3G -d /data
sudo docker run --rm -p 8888:3333 -v /home/stud/refine:/data felixlohmeier/openrefine:2.6rc2 -i 0.0.0.0 -m 3G -d /data
```
Erläuterungen:
@ -38,4 +38,4 @@ Erläuterungen:
* ```stud``` durch eigenen Benutzernamen ersetzen
* ```-i 0.0.0.0``` öffnet den Docker-Container für den Zugriff aus dem Netzwerk
* ```-m 3G``` erlaubt dem Docker-Container bis zu 3 GB Arbeitsspeicher zu verwenden
* ```-d /data``` definiert das Arbeitsterzeichnis im Docker-Container
* ```-d /data``` definiert das Arbeitsterzeichnis im Docker-Container

View File

@ -20,6 +20,6 @@ Hinweise:
## Lösung
* OpenRefine auf dem Webserver starten: {%s%}sudo docker run --rm -p 8888:3333 -v /home/stud/refine:/data felixlohmeier/openrefine:2.6rc1 -i 0.0.0.0 -m 3G -d /data{%ends%}
* OpenRefine auf dem Webserver starten: {%s%}sudo docker run --rm -p 8888:3333 -v /home/stud/refine:/data felixlohmeier/openrefine:2.6rc2 -i 0.0.0.0 -m 3G -d /data{%ends%}
* OpenRefine aufrufen: {%s%}Auf dem lokalen Rechner im Browser (z.B. Firefox) die IP-Adresse des Webservers gefolgt mit Port 8888 aufrufen. Beispiel: https://192.168.1.1:8888{%ends%}
* Projekt erstellen: {%s%}Auf den Button "Durchsuchen" klicken und eine der in Aufgabe 1 heruntergeladenen Dateien auswählen. Im nächsten Bildschirm unten links bei Parse data as "XML files" auswählen, dann im Vorschaubildschirm auf den Pfad <record xmlns... klicken und dann oben rechts den Button "Create Project" drücken.{%ends%}
* Projekt erstellen: {%s%}Auf den Button "Durchsuchen" klicken und eine der in Aufgabe 1 heruntergeladenen Dateien auswählen. Im nächsten Bildschirm unten links bei Parse data as "XML files" auswählen, dann im Vorschaubildschirm auf den Pfad <record xmlns... klicken und dann oben rechts den Button "Create Project" drücken.{%ends%}

50
06_4_zwischenfazit.md Normal file
View File

@ -0,0 +1,50 @@
# 6.4 Zwischenfazit
## Zwischenstand - Wo stehen wir heute?
### a) Was haben wir bislang gemacht (Kapitel im Skript und jeweiliges Ziel)
1) Einführung in Discovery-Systeme in Bibliotheken: Einstieg ins Thema
2) Open-Source-Software für Bibliothekskataloge: Potentiale für den Einsatz von Open Source Software im Bibliothekswesen realistisch einschätzen können
3) Grundinstallation der Arbeitsumgebung: Arbeitsumgebung einrichten und sich auf der Linux Konsole zurechtfinden
4) Schnittstellen zum Laden der Metadaten: Metadaten der HAW-Bibliothek über eine Schnittstelle laden und verschiedene Metadatenformate kennenlernen
5) Exkurs zu Metadaten in Bibliotheken: Kleiner thereotischer Exkurs zu Metadatenstandards, bevor wir weiter mit den Daten arbeiten.
6) Installation von OpenRefine mit Docker: Container-Lösungen am Beispiel von Docker kennenlernen, OpenRefine installieren und Daten in ein neues Projekt in OpenRefine laden
### b) Wo stehen wir auf dem Weg zum eigenen Bibliothekskatalog?
Das haben Sie bislang erreicht:
* Sie haben einen eigenen Webserver auf einer virtuellen Maschine und wissen wie Sie auf dem Server Befehle ausführen.
* Sie haben die Metadaten der HAW-Bibliothek in 100er-Schnipseln im Format MARCXML vorliegen. Sie haben Beispieldatensätze von MARCXML gesehen.
* Sie haben OpenRefine (als Docker Container) installiert und können OpenRefine starten und aufrufen.
Bis zum eigenen Bibliothekskatalog stehen noch die folgenden Schritte an:
* Sie transformieren die Daten mit OpenRefine von MARCXML in ein Format, das leicht in einen Suchindex zu laden ist.
* Sie installieren und konfigurieren auf ihrem Webserver den Suchmaschinenindex mit Solr und laden die Daten in den Suchindex.
* Sie installieren und konfigurieren auf ihrem Webserver das Content-Management-System TYPO3 und die Erweiterung TYPO3-find.
Wenn alles fertig ist, läuft auf ihrem Webserver:
* Der Suchmaschinenindex Solr (beinhaltet die Daten)
* Das Content-Management-System TYPO3 mit der Erweiterung TYPO3-find
OpenRefine ist also nur Mittel zum Zweck, um die Daten in ein Format zu transformieren, dass Sie in den Suchindex laden können.
## Nachtrag zum Thema Virtualisierung und Docker: Wie sieht unser Systemaufbau denn jetzt eigentlich aus?
### Webserver
* Ihr Webserver ist eine virtuelle Maschine (VM) auf Ihrem Rechner mit den Leistungsdaten (CPU, Arbeitsspeicher und Festplatte), die Sie der VM in Kapitel 3.1 gewährt haben. Ihre VM teilt sich die Internetverbindung mit Ihrem Rechner.
* Stichwort "Virtualisierung": In Rechenzentren laufen solche virtuellen Maschinen, meist zusammen mit vielen anderen virtuellen Maschinen auf einem Großrechner. Die Virtualisierung ist so vollkommen, dass die virtuelle Maschine sich genau so verhält, als ob im Serverraum ein normaler PC stehen würde.
* Auf Ihrem Server ist ein Linux-Betriebssystem installiert, genauer: Debian 8.5 (auch "Debian Jessie" genannt) zzgl. der Erweiterungen die [TurnKey Core](https://www.turnkeylinux.org/core) mitbringt.
* Um weitere Programme (OpenRefine, später auch der Suchmaschinenindex Solr, TYPO3 und TYPO3-find) leichter installieren und starten zu können, haben wir zunächst Docker auf dem Linux-Betriebssystem installiert.
* OpenRefine starten wir (bei Bedarf!) mit Hilfe von Docker als Container. Durch die Befehle, die wir Docker beim Aufruf mitgeben, machen wir OpenRefine im Netzwerk unter dem Port 8888 verfügbar und definieren als Arbeitsverzeichnis ihr persönliches Verzeichnis auf dem Server (/home/stud/).
### Arbeitsplatzrechner:
* Von ihrem Rechner oder einem anderen Rechner in Ihrem Netzwerk können Sie auf den Webserver zugreifen:
* mit Putty über das SSH-Protokoll auf die Kommandozeile des Linux-Betriebssystems (Debian 8.5) ihres Webservers . Damit haben Sie die gleichen Möglichkeiten, als wenn Sie an den Server einen Bildschirm, eine Maus und eine Tastatur anschließen würden.
* mit WinSCP über das SCP-Protokoll auf die Dateien ihres Webservers. Sie können damit Dateien herunterladen oder hochladen.
* mit einem Browser (Firefox, Chrome, usw.) auf OpenRefine unter der Adresse http://<IP-Adresse>:8888 (Beispiel: http://192.168.1.1:8888), später auf Solr (http://192.168.1.1:8983), TYPO3 (http://192.168.1.1/typo3) und den Bibliothekskatalog 192.168.1.1 (also ganz ohne Port).

View File

@ -29,6 +29,7 @@
* [6.1 Installation Docker](06_1_installation_docker.md)
* [6.2 Installation OpenRefine](06_2_installation_openrefine.md)
* [6.3 OpenRefine starten und Daten laden](06_3_openrefine_starten_und_daten_laden.md)
* [6.4 Zwischenfazit](06_4_zwischenfazit.md)
* [7 Datentransformation mit OpenRefine](07_0_datentransformation_mit_openrefine.md)
* [7.1 Facetten und Text Filter](07_1_facetten_und_text_filter.md)
* [7.2 Records bilden](07_2_records_bilden.md)