5 novembre 2007
Aspiration des pages web avec Cygwin
Lundi 5 novembre
Pour l'aspiration des pages web sous Cygwin, on utilise la commande : wget -i <file>
Les URL sont classées par sens dans un fichier que l'on nomme "PISTE".
Ce fichier comprend un sous-dossier par sens :
Chaque dossier comprend un fichier en .txt comprenant les URL :
Avec Cygwin, on se place dans un nouveau fichier que l'on nomme "Pages_aspirees", et on crée de la même façon des sous-dossiers qui serviront à stocker les pages aspirées.
Puis on aspire chaque dossier :
Voilà le résultat :
Puis on répète l'opération pour chaque dossiers, en veillant bien à se placer dans le bon dossier à chaque fois pour enregistrer les pages.
Publicité
Publicité
Commentaires