Wget - Outil de récupération de fichier

Qu'est ce que c'est ?

Wget est un outil permettant d'aspirer des sites de manière non interactive, c'est à dire qu'il peut tourner en fond sans nécéssiter l'intervention d'un utilisateur une fois lancé. Outre cette fonction d'aspiration - rarement utile sur un serveur - cet outil permet surtout de récupérer des fichiers distants, que cela soit par http, https, ou ftp.

Quelles utilisations ?

Dans le cadre d'une installation sur un serveur, wget est principalement utilisé pour deux taches : récupérer des fichiers à installer - ce qui est plus rapide que de le récupérer sur son ordi perso pour le renvoyer ensuite, même quand on a l'adsl - et pour les crons devant appeler un script php à heure précise, comme si un navigateur le consultait.

Installation

Comme bien souvent avec une debian, l'installation s'effectue facilement avec apt-get. Il vous faut donc vous logguer en root par la console (par ssh), et taper les commandes suivantes :

apt-get install wget

Reading Package Lists... Done
Building Dependency Tree... Done
The following NEW packages will be installed:
  wget
0 packages upgraded, 1 newly installed, 0 to remove and 25 not upgraded.
Need to get 332kB of archives. After unpacking 1233kB will be used.
Get:1 http://security.debian.org stable/updates/main wget 1.8.1-6.1 [332kB]
Fetched 332kB in 0s (590kB/s)
Selecting previously deselected package wget.
(Reading database ... 17253 files and directories currently installed.)
Unpacking wget (from .../wget_1.8.1-6.1_i386.deb) ...
Setting up wget (1.8.1-6.1) ...

Comment ca marche ?

L'usage pour récupérer un fichier est tres simple :

wget http://www.sivit.fr

--23:35:42-- http://www.sivit.fr/
        => `index.html'
Résolution de www.sivit.fr... complété.
Connexion vers www.sivit.fr[81.91.65.141]:80...connecté.
requête HTTP transmise, en attente de la réponse...302 Found
Location: http://sivit.fr/fr/index.php?click= [suivant]
--23:35:43-- http://sivit.fr/fr/index.php?click=
        => `index.php?click='
Résolution de sivit.fr... complété.
Connexion vers sivit.fr[81.91.65.141]:80...connecté.
requête HTTP transmise, en attente de la réponse...200 OK
Longueur: non spécifié [text/html]

    [ <=> ] 16,518 59.74K/s

23:35:43 (59.74 KB/s) - « index.php?click= » sauvegardé [16518]

L'option la plus utile est -O qui permet de spécifier dans quel fichier doit être sauvegarder l'url récupéree.

Pour les autres options, notamment l'aspiration - qui est en fait une récupération qui suit les urls trouvées dans les fichiers aspirés - vous pouvez faire un man wget ou un info wget.

Utilisations particulières

Pour une utilisation en cron, il suffit simplement d'ajouter la commande wget http://www.domaine.com/url/du/script.php dans une tache cron (par webmin ou avec la commande crontab -e, voir les *futurs* tutoriaux à ce sujet).

Conclusion

Wget est un outil pratique, léger - un peu plus de 300k tout mouillé avec sa documentation - et facile à installer. Pourquoi s'en priver ?

Manico