66 lines
4.0 KiB
Markdown
66 lines
4.0 KiB
Markdown
# 1.3 Übung: Text durchsuchen und Wörter zählen auf der Kommandozeile
|
|
|
|
Im Laufe des Kursus verwenden wir des Öfteren die [Kommandozeile](https://de.wikipedia.org/wiki/Kommandozeile), um Programme zu installieren und zu konfigurieren. Gleichzeitig ist sie ein mächtiges Werkzeug, um mit Textdateien umzugehen. Es lohnt also den Umgang damit kurz zu üben.
|
|
|
|
## Kommandozeile \(Terminal\) starten {#kommandozeile-terminal-starten}
|
|
|
|
Die Kommandozeile \(auch "[Terminal](https://wiki.ubuntuusers.de/Terminal/)" genannt\) von Ubuntu MATE erreichen wir über das Menü "Anwendungen -> Systemwerkzeuge -> MATE-Terminal".
|
|
|
|
![](/images/mate-terminal.png)
|
|
|
|
## Installieren Sie das kleine Programm curl {#installieren-sie-das-kleine-programm-curl}
|
|
|
|
Für die folgende Übung wird das \(sehr\) kleine Programm curl benötigt. Bei vielen Linux-Distributionen ist es vorinstalliert, aber bei Ubuntu MATE nicht. Starten Sie zur Installation die Kommandozeile \(Terminal\) und geben Sie den folgenden Befehl ein:
|
|
|
|
`sudo apt-get install curl`
|
|
|
|
Nach dem kurzen Installationsprozess sollte es etwa so aussehen:
|
|
|
|
![](/images/curl-installieren.png)
|
|
|
|
## Übung: Text durchsuchen und Wörter zählen {#übung-text-durchsuchen-und-wörter-zählen}
|
|
|
|
Starten Sie die Kommandozeile \(Terminal\) und geben Sie die folgenden Befehle ein:
|
|
|
|
### Schritt 1: "War and Peace" von Leo Tolstoy herunterladen und anzeigen {#schritt-1-war-and-peace-von-leo-tolstoy-herunterladen-und-anzeigen}
|
|
|
|
* `curl http://www.gutenberg.org/files/2600/2600-0.txt > war_and_peace.txt`
|
|
* `cat war_and_peace.txt | less`
|
|
|
|
Der Anhang `| less` am zweiten Befehl zeigt den Text so an, dass Sie mit den Pfeiltasten scrollen können. Beenden können Sie die Ansicht mit der Taste `q`.
|
|
|
|
### Schritt 2: Zeilen, Wörter und Zeichen zählen mit wc {#schritt-2-zeilen-wörter-und-zeichen-zählen-mit-wc}
|
|
|
|
* `wc war_and_peace.txt`
|
|
|
|
Die drei Nummern sind Zeilen, Wörter und Zeichen \(in dieser Reihenfolge\).
|
|
|
|
### Schritt 3: Suche nach Vorkommnissen der Wörter "war" and "peace" {#schritt-3-suche-nach-vorkommnissen-der-wörter-war-and-peace}
|
|
|
|
* `cat war_and_peace.txt | grep -i -ow war | wc`
|
|
* `cat war_and_peace.txt | grep -i -ow peace | wc`
|
|
|
|
Was wird häufiger in diesem Text erwähnt? Krieg oder Frieden?
|
|
|
|
## Hilfreiche Grundlagen bei der Arbeit mit der Kommandozeile {#hilfreiche-grundlagen-bei-der-arbeit-mit-der-kommandozeile}
|
|
|
|
* Dateien und Verzeichnisse: siehe [Cheatsheet](http://cheatsheetworld.com/programming/unix-linux-cheat-sheet/)
|
|
* Abbruch / Programm beenden: _**STRG**_ und _**C**_
|
|
* Kurzhilfe eines Programms aufrufen: _**Programmname**_** --help**
|
|
* Handbuch eines Programms aufrufen: **man **_** Programmname**_
|
|
* Automatische Ergänzung von Befehlen: _**Tab**_
|
|
* Vorige Kommandos anzeigen: _**Pfeiltaste nach oben**_
|
|
* Suche in Historie der Kommandozeile: _**STRG**_ und _**R**_
|
|
|
|
Die meisten Antworten finden sich über einfache Suchen im Internet. Meist reicht es an die passenden Suchbegriffe das Wort "linux" mit anzuhängen.
|
|
|
|
## Literatur {#literatur}
|
|
|
|
* Ausführlichere Übung im Blog des Projekts Librecat/Catmandu: [https://librecatproject.wordpress.com/2014/12/04/day-4-grep-less-and-wc/](https://librecatproject.wordpress.com/2014/12/04/day-4-grep-less-and-wc/). Dabei bitte beachten: Die dort referenzierte Textdatei ist anders strukturiert als die obige _war\_and\_peace.txt_ und liefert daher andere Zählergebnisse.
|
|
* Dreistündiger Einführungskurs "Shell Lessons for Librarians" im Projekt "Library Carpentry" [http://data-lessons.github.io/library-shell/](http://data-lessons.github.io/library-shell/)
|
|
* Eine gute Einführung in die Linux-Kommandozeile bietet [http://linuxcommand.org](http://linuxcommand.org) von William E. Shotts, der auch ein kostenfreies [540-Seiten-Buch](http://linuxcommand.org/tlcl.php) darüber geschrieben hat.
|
|
* Es gibt sehr viele praktische kleine Programme auf der Kommandozeile. Zur Übersicht eignet sich daher ein Spickzettel \("Cheatsheet"\) sehr gut. Ein Beispiel für die unzähligen Cheatsheets: [http://cheatsheetworld.com/programming/unix-linux-cheat-sheet/](http://cheatsheetworld.com/programming/unix-linux-cheat-sheet/).
|
|
|
|
|
|
|