Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
Projet_encadré
Projet_encadré
Publicité
Archives
5 novembre 2007

Aspiration des pages web avec Cygwin

Lundi 5 novembre

Pour l'aspiration des pages web sous Cygwin, on utilise la commande : wget -i <file>

Les URL sont classées par sens dans un fichier que l'on nomme "PISTE".
Ce fichier comprend un sous-dossier par sens :

arborescence

Chaque dossier comprend un fichier en .txt comprenant les URL :

url fichier_txt

Avec Cygwin, on se place dans un nouveau fichier que l'on nomme "Pages_aspirees", et on crée de la même façon des sous-dossiers qui serviront à stocker les pages aspirées.

Puis on aspire chaque dossier :

cygwin

Voilà le résultat :

index_blog

Puis on répète l'opération pour chaque dossiers, en veillant bien à se placer dans le bon dossier à chaque fois pour enregistrer les pages.


Publicité
Publicité
Commentaires
Publicité