Script count-tsv.sh erweitert

This commit is contained in:
Felix Lohmeier 2016-12-19 00:24:58 +01:00
parent 084eb3cc74
commit a793ff8a46
1 changed files with 10 additions and 6 deletions

View File

@ -1,31 +1,35 @@
#!/bin/bash #!/bin/bash
# Script zur Zählung von belegten Werten in TSV-Dateien # Script zur Zählung von belegten Werten in TSV-Dateien
# Stand: 20.11.2016 # Stand: 20.11.2016
# Nutzung: ./count.sh file.tsv # Nutzung: ./count-tsv.sh file.tsv
# Abfrage der Dateinamen # Abfrage der Dateinamen
if [ -z "$1" ] if [ -z "$1" ]
then then
echo "Bitte Dateinamen angeben!" echo "Bitte Dateinamen angeben!"
echo "Beispiel: ./count.sh file.tsv" echo "Beispiel: ./count-tsv.sh file.tsv"
exit exit
else else
echo "Folgende Dateien werden untersucht:" echo "Folgende Dateien werden untersucht:"
files=($*) files=($*)
echo ${files[@]} printf '%s\n' "${files[@]}"
echo ""
fi fi
# Schleife für mehrere Dateien # Schleife für mehrere Dateien
for file in "${files[@]}"; do for file in "${files[@]}"; do
echo ""
echo $file
echo ""
printf '%-30s\t%-10s\t%-10s \n' "SPALTENNAME" "ZEILEN" "ZEILEN-MIT-␟"
# Spaltennamen erfassen # Spaltennamen erfassen
readarray columns < <(head -q -n1 haw_000001_450200_minimal.tsv | tr '\t' '\n' | cat) readarray columns < <(head -q -n1 ${file} | tr '\t' '\n' | cat)
# Belegte Zellen in Spalten zählen und ausgeben # Belegte Zellen in Spalten zählen und ausgeben
number=1 number=1
for column in "${columns[@]}"; do for column in "${columns[@]}"; do
echo -e ${column} "\t\t" $(cut -d$'\t' -f ${number} ${file} | grep -v '^$' | wc -l) printf '%-30s\t%-10d\t%-10d \n' ${column} $(cut -d$'\t' -f ${number} ${file} | grep -v '^$' | wc -l) $(cut -d$'\t' -f ${number} ${file} | grep '␟' | wc -l)
number=$(($number+1)) number=$(($number+1))
done done
done done