Canalblog
Suivre ce blog Administration + Créer mon blog
Publicité
Projet_encadré
Projet_encadré
Publicité
Archives
26 décembre 2007

Cloture du projet

Mercredi 26 décembre Après la construction du site pour la présentation des résultats finaux, le projet touche à sa fin. Site visible ICI
Publicité
Publicité
16 décembre 2007

SCRIPT FINI

Dimanche 15 décembre Ca y est. Le script est enfin terminé... Tous les petits problèmes ont été résolus : - pour les pages que le programme semblait "oublier", c'était tout simplement notre motif d'egrep qui ne prenait pas certains mots en compte (lorsqu'ils...
10 décembre 2007

Autres petits problèmes

Lundi 10 décembre On constate encore quelques petites problèmes quant à l'aspiration des pages web, et a leur enregistrement dans un fichier texte. En effet, la fonction - dump ne fonctionne pas dans les documents en .pdf (c'est le cas des URL 3 et 4...
6 décembre 2007

Dernière étape : le contexte : le script !!!

Jeudi 6 décembre On s'approche de la version finale du script !Téléchargeable ici : script Et le résultat : test Il ne reste plus qu'à travailler sur la mise en page et à affiner la recherche de grep pour ne pas avoir un grand bloc de texte pas forcément...
3 décembre 2007

Dernière étape : le contexte : Introduction

Dernière étape : le contexte : Introduction
Dimanche 3 décembre On a encore une dernière colonne à réaliser dans les tableaux : il s'agit de récupérer les lignes des fichiers dumpés contenant le mot PISTE ou ses équivalents en anglais. A partir de là, nouvelle question : comment indiquer au programme...
Publicité
Publicité
29 novembre 2007

Script avec le dump

Jeudi 29 novembre Le voici le voilà ! Après une petite semaine d'interruption passé sur la Génération automatique de textes : THE script est enfin arrivé ! Avec ajout de la fonction dump, qui récupère le texte des pages aspirées et l'enregistre dans un...
15 novembre 2007

Script du tableau HTML - 2éme partie

Jeudi 15 novembre Nous avons donc maintenant : un script qui aspire les liens URL dans les différents dossiers de notre arborescence un script qui crée un tableau en html en allant chercher les url dans les dossiers où elles se trouvent. En concaténant...
14 novembre 2007

Script du tableau HTML - 1ère partie

Mercredi 14 novembre Il s'agit d'écrire un script en Bash permettant d'aller chercher les URL dans le fichier où elles sont stockées et de les placer ensuite dans un tableau html.Encore une fois, c'est la fonction $ cat qui est utilisée ici. Pour l'exercice,...
12 novembre 2007

Script pour aspirer les pages

Comme nous l'avons déjà écrit, c'est la commande WGET qui nous permet d'aspirer des pages web. Pour plus d'informations à ce sujet, voir la page http://pwet.fr/man/linux/commandes/wget Dans l'article précédent, nous utilisions l'option -i qui permet...
5 novembre 2007

Aspiration des pages web avec Cygwin

Aspiration des pages web avec Cygwin
Lundi 5 novembre Pour l'aspiration des pages web sous Cygwin, on utilise la commande : wget -i Les URL sont classées par sens dans un fichier que l'on nomme "PISTE".Ce fichier comprend un sous-dossier par sens : Chaque dossier comprend un fichier...
Publicité
Publicité
1 2 > >>
Publicité