Projet_encadré

26 décembre 2007

Cloture du projet

Mercredi 26 décembre Après la construction du site pour la présentation des résultats finaux, le projet touche à sa fin. Site visible ICI

Posté par Etudiant_TAL à 10:34 - Commentaires […] - Permalien [#]

Partager cet article

Vous aimez ?

0 vote

16 décembre 2007

SCRIPT FINI

Dimanche 15 décembre Ca y est. Le script est enfin terminé... Tous les petits problèmes ont été résolus : - pour les pages que le programme semblait "oublier", c'était tout simplement notre motif d'egrep qui ne prenait pas certains mots en compte (lorsqu'ils...

Posté par Etudiant_TAL à 14:20 - Commentaires […] - Permalien [#]

Partager cet article

Vous aimez ?

0 vote

10 décembre 2007

Autres petits problèmes

Lundi 10 décembre On constate encore quelques petites problèmes quant à l'aspiration des pages web, et a leur enregistrement dans un fichier texte. En effet, la fonction - dump ne fonctionne pas dans les documents en .pdf (c'est le cas des URL 3 et 4...

Posté par Etudiant_TAL à 17:46 - Commentaires […] - Permalien [#]

Partager cet article

Vous aimez ?

0 vote

6 décembre 2007

Dernière étape : le contexte : le script !!!

Jeudi 6 décembre On s'approche de la version finale du script !Téléchargeable ici : script Et le résultat : test Il ne reste plus qu'à travailler sur la mise en page et à affiner la recherche de grep pour ne pas avoir un grand bloc de texte pas forcément...

Posté par Etudiant_TAL à 14:57 - Commentaires […] - Permalien [#]

Partager cet article

Vous aimez ?

0 vote

3 décembre 2007

Dernière étape : le contexte : Introduction

Dimanche 3 décembre On a encore une dernière colonne à réaliser dans les tableaux : il s'agit de récupérer les lignes des fichiers dumpés contenant le mot PISTE ou ses équivalents en anglais. A partir de là, nouvelle question : comment indiquer au programme...

Posté par Etudiant_TAL à 19:50 - Commentaires […] - Permalien [#]

Partager cet article

Vous aimez ?

0 vote

29 novembre 2007

Script avec le dump

Jeudi 29 novembre Le voici le voilà ! Après une petite semaine d'interruption passé sur la Génération automatique de textes : THE script est enfin arrivé ! Avec ajout de la fonction dump, qui récupère le texte des pages aspirées et l'enregistre dans un...

Posté par Etudiant_TAL à 14:04 - Commentaires […] - Permalien [#]

Partager cet article

Vous aimez ?

0 vote

15 novembre 2007

Script du tableau HTML - 2éme partie

Jeudi 15 novembre Nous avons donc maintenant : un script qui aspire les liens URL dans les différents dossiers de notre arborescence un script qui crée un tableau en html en allant chercher les url dans les dossiers où elles se trouvent. En concaténant...

Posté par Etudiant_TAL à 23:08 - Commentaires […] - Permalien [#]

Partager cet article

Vous aimez ?

0 vote

14 novembre 2007

Script du tableau HTML - 1ère partie

Mercredi 14 novembre Il s'agit d'écrire un script en Bash permettant d'aller chercher les URL dans le fichier où elles sont stockées et de les placer ensuite dans un tableau html.Encore une fois, c'est la fonction $ cat qui est utilisée ici. Pour l'exercice,...

Posté par Etudiant_TAL à 17:13 - Commentaires […] - Permalien [#]

Partager cet article

Vous aimez ?

0 vote

12 novembre 2007

Script pour aspirer les pages

Comme nous l'avons déjà écrit, c'est la commande WGET qui nous permet d'aspirer des pages web. Pour plus d'informations à ce sujet, voir la page http://pwet.fr/man/linux/commandes/wget Dans l'article précédent, nous utilisions l'option -i qui permet...

Posté par Etudiant_TAL à 21:27 - Commentaires […] - Permalien [#]

Partager cet article

Vous aimez ?

0 vote

5 novembre 2007

Aspiration des pages web avec Cygwin

Lundi 5 novembre Pour l'aspiration des pages web sous Cygwin, on utilise la commande : wget -i Les URL sont classées par sens dans un fichier que l'on nomme "PISTE".Ce fichier comprend un sous-dossier par sens : Chaque dossier comprend un fichier...

Posté par Etudiant_TAL à 16:56 - Commentaires […] - Permalien [#]

Partager cet article

Vous aimez ?

0 vote