HelloBash Ep2
contenu en cours de rédaction
Contents
Un peu de théorie
Le shell que vous utilisez est probablement un stty
$ tty /dev/pts/0 $ whatis pts pts (4) - pseudoterminal master and slave $ stty speed 38400 baud; line = 0; -brkint -imaxbel
Un pts/stty est une simulation de tty, qui signifie teletype, un descendant du télégraphe, qui communiquait par modem via un réseau dédié, le teletype network... ou telnet
(!) défini dès la RFC 15 qui est analysée ici.
Pour une analyse poussée des tty et des teletype voir ici.
Un tty est un programme dont la fonctionnalité première est de gèrer du flux de texte.
Voilà ce que fait -un peu caricaturalement- un terminal comme à l'époque du teletype :
- Recevoir un text (input/STDIN) : création d'une chaîne de caractères individuels
- Analyser le texte saisi (parsing) : découpe de la chaîne de texte en commande + arguments
- Exécuter la commande avec ses arguments (exec[vlpe]) et retransmission des chaînes de sortie standard (output/STDOUT) et d'erreurs (errors/STDERR)
Ce qu'on appelle flux (ou streams) ce sont les différentes chaînes de caractères en transit : les STDIN, STDOUT, STDERR
Bash permet de manipuler ces flux. Force du shell : combiner des commandes existantes entre elles, via les flux.
Métaphore: un teletype qui enverrait un message en Italie, récupèrerait la sortie, remplacerait certains mots et retransmettrait le résultat en Allemagne.
Dans le cas d'un stty, pas besoin d'édition papier, tout se fait avec des chaînes de texte.
Les types de manipulation
Nous allons voir les manipulations de flux suivantes
- les redirections
- les pipes (pipelines/tubes)
Dans les deux cas nous verrons des commandes utiles associées à ces manipulations
Les redirections de flux
STDIN, STDOUT, STDERR
Un terminal est instancié avec 3 flux natifs numérotés 0, 1, et 2
$ ls -go /proc/self/fd total 0 lrwx------ 1 <...> 0 -> /dev/pts/4 lrwx------ 1 <...> 1 -> /dev/pts/4 lrwx------ 1 <...> 2 -> /dev/pts/4 lr-x------ 1 <...> 3 -> /proc/6017/fd $ ls -go /dev/STDIN lrwxrwxrwx 1 <...> /dev/STDIN -> /proc/self/fd/0
Ce sont des descripteurs de fichiers (file descriptors/fd) et ils peuvent être manipulés en les substituant avec d'autres descripteurs de fichiers.
Ils ont chacun un numéro standardisé :
- 0 == STDIN
- 1 == STDOUT
- 2 == STDERR
La redirection permet aux descripteurs de fichier des commandes d'être dupliqués, ouverts, fermés, de se référer à différents fichiers et de modifier les fichiers lus et écrits par la commande.
Les opérateurs de redirection peuvent précéder ou apparaître n'importe où dans une commande simple ou peuvent suivre une commande. Les redirections sont traitées dans l'ordre dans lequel elles apparaissent, de gauche à droite.
Les deux opération suivantes auront des résultats différents
$ commande redirection_1 redirection_2 $ commande redirection_2 redirection_1
Utilisation des flux standards pour les redirections
Les numéros de flux (0,1,2) sont utilisés pour rediriger les flux par défaut
Par défault, les opérateurs qui manipulent les flux input utilisent le numéro de fd 0 (STDIN).
Par défault, les opérateurs qui manipulent les flux output utilisent le numéro de fd 1 (STDOUT)
Pour signifier qu'on veut rediriger vers un flux existant, on le préfixe avec un "&", sinon Bash pense que vous parlez du fichier nommé "1", pas de /proc/self/fd/1.
Redirections de STDOUT et STDERR
Redirection simple : > et >>
Un simple > remplace un contenu existant vers une sortie existante ou créable
Un double >> concatène la sortie vers une sortie existante ou créable
$ ls > /tmp/list.txt $ ls >> /tmp/list.txt
On peut décider de créer un fichier avec les syntaxes suivantes, qui ne prennent aucune entrée
$ : > /tmp/foo $ > /tmp/foo
Redirections vers un fichier sans écraser le contenu existant : >| et >>|
Si on active la fonction noclobber
de Bash, on ne peut modifier un fichier existant à moins d'utiliser cette syntaxe particulière
$ echo "ok" > /tmp/test $ set -o noclobber $ echo "bad" > /tmp/test $ echo "works" |> /tmp/test
Redirection de STDERR : 2>
Si on veut la sortie et les erreurs dans des fichiers différents
$ curl https://www.tmplab.org 1>/tmp/std 2>/tmp/err
Si on veut enregistrer à la fois les erreurs et la sortie dans un même fichier.
$ ls -lh /foo > /tmp/out 2>&1 $ cat /tmp/out
Attention, il faut bien rediriger d'abord la sortie sortie vers le fichier, sinon STDERR reste sur STDOUT
$ ls -lh /foo > /tmp/out 2>&1 ls: impossible d'accéder à '/foo': Aucun fichier ou dossier de ce type
Redirection de STDERR et STDOUT : &>
On utilise cette syntaxe pour rediriger 1 et 2 vers un descripteur de fichier commun
$ ls -lh /proc/self/fd &>/tmp/out $ cat /tmp/out
On voit que 1 et 2 sont bien pointées vers /dev/null
Envoi de caractères dans STDERR : >&2
On peut rediriger une sortie vers un flux numéroté comme STDERR.
$ echo "Ooops" 1>/dev/null >&2
Redirections de STDIN
Redirection par un contenu de fichier : <
Cette syntaxe redirige par défaut le flux numéroté "0" vers le fichier indiqué
$ ls /proc/self/fd -lh </tmp/out
Elle peut être utile pour lancer une série de commandes SQL :
$ echo "show databases" > /tmp/query.sql $ mysql < /tmp/query.sql
Redirection par un document (Here Documents) : <<
Un Here Documents crée une entrée multiligne qui est passée en STDIN à la commande.
L'entrée est démarquée par la suite de caractères qui suit les caractères "<<". Elle se termine quand la suite de caractères est répétée sur une seule ligne avant un retour à la ligne, sans espaces.
$ cat << HEREDOC hello Bash It's great. We love it! HEREDOC
On peut créer des fichiers complexes en associant à un HEREDOC
$ cat 1>/tmp/out << SOMETHING my file is multiline! SOMETHING
Redirection par une chaîne (Here Strings) : <<<
Un
$ cat <<< "Hello Bash" $ bash <<< "sleep 1"
Création et fermeture de flux
Fermeture d'un flux : N>&-
Cette commande supprime le flux numéroté "N" qu'on place avant le ">&-" : il disparaît de la liste des descripteurs de fichiers du processus.
$ bash -c "echo $$; exec 2>&-; sleep 60;" $ ls -lh /proc/PID/fd # PID = le numéro du processus retourné par la commande ci-dessus
Création de nouveaux flux : N<
Cette syntaxe génère un flux numéroté "N".
Ici, on créé un flux "5" en copiant la cible de 2, qui lui-même change deux fois de directions.
$ ls -lh /proc/self/fd 2>/tmp/out 5<&2 2>/dev/null
Ouverture d'un flux pour entrée et sortie : N<>
Cette syntaxe permet de définir un flux numéroté N qui peut être utilisé à la fois pour lire et pour écrire.
$ echo 1234567890 > /tmp/file $ exec 3<> /tmp/file $ read -n 4 <&3 $ echo -n . >&3 $ exec 3>&- $ cat /tmp/file
Par exemple on peut appeler un flux TCP :
$ exec 3<>/dev/tcp/neverssl.com/80 $ echo -e "GET / HTTP/1.1\r\nhost: neverssl.com\r\nConnection: close\r\n\r\n" >&3 $ cat <&3
Ouverture d'un flux "anonyme" : <( command )
Cette syntaxe crée un type de descripteur de fichier particulier (un FIFO) qui contient le résultat de la commande appelée.
Par exemple, elle évite pour la commande suivante de stocker les résultats des commandes dans deux fichiers avant de les comparer.
$ diff -y <(man chattr) <(man chmod)
Les Pipes
Le pipe simple : |
Cette syntaxe permet de transmettre la STDOUT d'une commande comme STDIN d'une autre commande.
$ echo "hello" | ls -lh /proc/self/fd
On voit que le fd "0" est devenu un "pipe" : les données sont "versées" par la première commande dans la seconde.
Exemple. La première commande liste des fichiers. Cette liste est transmise à grep qui ne sélectionne que les lignes contenant un mot particulier
$ ls -lh /etc | grep shadow
Cette syntaxe toute simple ouvre beaucoup de possibilités. Quelques exemples.
$ ls -lh /etc | wc $ ls -lh /etc | head $ ls -lh /etc | tail $ ls -lh /etc | tr "aeiou" "_" $ ls -lh /etc |fmt -g 20 -s -
Les commandes comme fmt
acceptent souvent le caractère "-" pour signaler que les données à traiter sont fournies en input
On peut se retrouver à enchaîner les pipes.
$ cat *.txt | sort | uniq > result-file
Le pipe de redirection multi sorties : |&
$ ls /foo |& cat >/tmp/out
Autre commandes
tee
Afficher sur l'écran la sortie standard et l'envoyer dans un fichier simultanément
$ cmd | file
Descripteurs de fichiers nommés
Open a file for writing using a named file descriptor called {filew} (bash 4.1+). Ouvre un flux selon un nom de variable fourni. Le contenu de la variable est le numéro du flux.
$ exec {myfd}> /tmp/out $ echo $myfd $ ls -lh /proc/self/fd $ echo "Noice" >&$myfd $ cat /tmp/out
Intervertir STDERR et STDOUT
Cette ligne stocke STDOUT dans un flux numéroté "3", puis copie la cible de STDERR vers flux "1", avant de recopier STDIN vers le flux "2"
$ echo "hello bash" 3>&1 1>&2 2>&3 $ curl -v https://www.tmplab.org 1>/tmp/out 2>/tmp/err 3>&1 1>&2 2>&3
Récupérer les codes de sortie de commandes enchaînées avec des pipes
$ cmd1 | cmd2 | cmd3 | cmd4 $ echo ${PIPESTATUS[@]}
Sources
- https://catonmat.net/bash-one-liners-explained-part-three
- https://catonmat.net/ftp/bash-redirections-cheat-sheet.pdf
- https://xavcc.frama.io/introduction-stream/
- https://developer.ibm.com/tutorials/l-lpic1-103-2/
- https://developer.ibm.com/tutorials/l-lpic1-103-4/
- https://www.gnu.org/software/bash/manual/html_node/Redirections.html
- https://www.tldp.org/LDP/abs/html/io-redirection.html
- https://brennan.io/2015/01/16/write-a-shell-in-c/