Suivre ce blog
Administration
Connexion
+
Créer mon blog
Publicité
Projet_encadré
Projet_encadré
Suivez en direct l'avancement du projet de Ludivine et A-Claire !
Accueil du blog
Créer un blog avec CanalBlog
Publicité
Recherche
Archives
2007
Décembre
(6)
Novembre
(10)
Octobre
(4)
Flux RSS
Projet_encadré
>
Categories
>
Projet
26 décembre 2007
Cloture du projet
Mercredi 26 décembre Après la construction du site pour la présentation des résultats finaux, le projet touche à sa fin. Site visible ICI
Publicité
Publicité
16 décembre 2007
SCRIPT FINI
Dimanche 15 décembre Ca y est. Le script est enfin terminé... Tous les petits problèmes ont été résolus : - pour les pages que le programme semblait "oublier", c'était tout simplement notre motif d'egrep qui ne prenait pas certains mots en compte (lorsqu'ils...
10 décembre 2007
Autres petits problèmes
Lundi 10 décembre On constate encore quelques petites problèmes quant à l'aspiration des pages web, et a leur enregistrement dans un fichier texte. En effet, la fonction - dump ne fonctionne pas dans les documents en .pdf (c'est le cas des URL 3 et 4...
6 décembre 2007
Dernière étape : le contexte : le script !!!
Jeudi 6 décembre On s'approche de la version finale du script !Téléchargeable ici : script Et le résultat : test Il ne reste plus qu'à travailler sur la mise en page et à affiner la recherche de grep pour ne pas avoir un grand bloc de texte pas forcément...
3 décembre 2007
Dernière étape : le contexte : Introduction
Dimanche 3 décembre On a encore une dernière colonne à réaliser dans les tableaux : il s'agit de récupérer les lignes des fichiers dumpés contenant le mot PISTE ou ses équivalents en anglais. A partir de là, nouvelle question : comment indiquer au programme...
Publicité
Publicité
29 novembre 2007
Script avec le dump
Jeudi 29 novembre Le voici le voilà ! Après une petite semaine d'interruption passé sur la Génération automatique de textes : THE script est enfin arrivé ! Avec ajout de la fonction dump, qui récupère le texte des pages aspirées et l'enregistre dans un...
15 novembre 2007
Script du tableau HTML - 2éme partie
Jeudi 15 novembre Nous avons donc maintenant : un script qui aspire les liens URL dans les différents dossiers de notre arborescence un script qui crée un tableau en html en allant chercher les url dans les dossiers où elles se trouvent. En concaténant...
14 novembre 2007
Script du tableau HTML - 1ère partie
Mercredi 14 novembre Il s'agit d'écrire un script en Bash permettant d'aller chercher les URL dans le fichier où elles sont stockées et de les placer ensuite dans un tableau html.Encore une fois, c'est la fonction $ cat qui est utilisée ici. Pour l'exercice,...
12 novembre 2007
Script pour aspirer les pages
Comme nous l'avons déjà écrit, c'est la commande WGET qui nous permet d'aspirer des pages web. Pour plus d'informations à ce sujet, voir la page http://pwet.fr/man/linux/commandes/wget Dans l'article précédent, nous utilisions l'option -i
qui permet...
5 novembre 2007
Aspiration des pages web avec Cygwin
Lundi 5 novembre Pour l'aspiration des pages web sous Cygwin, on utilise la commande : wget -i
Les URL sont classées par sens dans un fichier que l'on nomme "PISTE".Ce fichier comprend un sous-dossier par sens : Chaque dossier comprend un fichier...
Publicité
Publicité
1
2
>
>>
Publicité