Canalblog
Suivre ce blog Administration + Créer mon blog
Publicité
Projet_encadré
Projet_encadré
Publicité
Archives
25 novembre 2007

script avec les pages aspirées.

script avec les pages aspirées.
Dimanche 25 novembre Voici le nouveau scriptIl n'y a rien de très nouveau, puisqu'il s'agissait surtout de faire fonctionner l'ancien script avec la nouvelle arborescence, On notera donc quelques changements, mais pas de nouvelles notions depuis le dernier...
Publicité
Publicité
31 octobre 2007

Ensemble d'indices vs Traces et empreintes

Ensemble d'indices vs Traces et empreintes
Plus les recherches avancent, plus la nuance entre ces deux définitions que l'on pourrait croire différentes semble floue. L e TLFI nous donne la définition suivante (pour les deux sens qui nous intéressent ici): "Suite d'empreintes laissées par un être...
5 novembre 2007

Aspiration des pages web avec Cygwin

Aspiration des pages web avec Cygwin
Lundi 5 novembre Pour l'aspiration des pages web sous Cygwin, on utilise la commande : wget -i Les URL sont classées par sens dans un fichier que l'on nomme "PISTE".Ce fichier comprend un sous-dossier par sens : Chaque dossier comprend un fichier...
18 novembre 2007

Changement d'arborescence.

Changement d'arborescence.
Dimanche 18 novembre Comme nous l'avons dit dans l'article précédent, le résultat de notre script ne nous satisfait pas totalement. En effet, nous avons obtenu un tableau par sens et par langue, ce qui rend la page html relativement longue. De plus, et...
3 décembre 2007

Dernière étape : le contexte : Introduction

Dernière étape : le contexte : Introduction
Dimanche 3 décembre On a encore une dernière colonne à réaliser dans les tableaux : il s'agit de récupérer les lignes des fichiers dumpés contenant le mot PISTE ou ses équivalents en anglais. A partir de là, nouvelle question : comment indiquer au programme...
Publicité
Publicité
31 octobre 2007

Rapide historique

Jeudi 04 Octobre 2007 Recherche de plusieurs mots qui puissent présenter des ambiguïtés intéressantes. tableau, piste, pioche, place, plage, planche, imparfait, terrain, ... Dans un premier temps, c'est " pioche " qui arrive en tête. Nous commençons donc...
5 novembre 2007

URL - Deuxième Episode

Lundi 5 novembre ENSEMBLE D'INDICES / TRACES ET EMPREINTES - En Français : http://planet-terre.ens-lyon.fr/planetterre/XML/db/planetterre/metadata/LOM-traces-pas-hominides.xml http://www.lexpress.fr/info/quotidien/actu.asp?id=14323 http://circulaire.chez-alice.fr/empreintes/empreintes_doigts.htm...
1 novembre 2007

Comme promis...les URL's

Jeudi 1er novembre Voici donc la liste des URL's, classées suivant leur sens et la langue. AVIATION ET AEROSPATIALE On regroupe ces deux termes dans une même catégorie, car dans le cas du mot piste, il s'agit exactement de la même chose : en effet, une...
12 novembre 2007

Script pour aspirer les pages

Comme nous l'avons déjà écrit, c'est la commande WGET qui nous permet d'aspirer des pages web. Pour plus d'informations à ce sujet, voir la page http://pwet.fr/man/linux/commandes/wget Dans l'article précédent, nous utilisions l'option -i qui permet...
14 novembre 2007

Script du tableau HTML - 1ère partie

Mercredi 14 novembre Il s'agit d'écrire un script en Bash permettant d'aller chercher les URL dans le fichier où elles sont stockées et de les placer ensuite dans un tableau html.Encore une fois, c'est la fonction $ cat qui est utilisée ici. Pour l'exercice,...
15 novembre 2007

Script du tableau HTML - 2éme partie

Jeudi 15 novembre Nous avons donc maintenant : un script qui aspire les liens URL dans les différents dossiers de notre arborescence un script qui crée un tableau en html en allant chercher les url dans les dossiers où elles se trouvent. En concaténant...
29 novembre 2007

Script avec le dump

Jeudi 29 novembre Le voici le voilà ! Après une petite semaine d'interruption passé sur la Génération automatique de textes : THE script est enfin arrivé ! Avec ajout de la fonction dump, qui récupère le texte des pages aspirées et l'enregistre dans un...
4 décembre 2007

Dernière étape : le contexte : Problème

Lundi 4 décembre A partir de ce que l'on a dit précédemment, on imagine assez facilement ce qu'on va devoir ajouter à notre programme : 1. Une condition if, qui va nous permettre de séparer #mot_ou_traduction et les URL's,A partir de là, deux cas :si...
10 décembre 2007

Autres petits problèmes

Lundi 10 décembre On constate encore quelques petites problèmes quant à l'aspiration des pages web, et a leur enregistrement dans un fichier texte. En effet, la fonction - dump ne fonctionne pas dans les documents en .pdf (c'est le cas des URL 3 et 4...
16 décembre 2007

SCRIPT FINI

Dimanche 15 décembre Ca y est. Le script est enfin terminé... Tous les petits problèmes ont été résolus : - pour les pages que le programme semblait "oublier", c'était tout simplement notre motif d'egrep qui ne prenait pas certains mots en compte (lorsqu'ils...
5 novembre 2007

Ensemble d'indices VS Traces et empreintes... le retour !

Lundi 5 novembre Les sens anglais de "lead" et "track" étant finalement eux aussi très proche, nous traiterons donc ces deux "pistes" comme un seul et même sens.
31 octobre 2007

Présentation

Mercredi 31 octobre 2007 Création du blog de Ludivine KUZNIK et Anne-Claire MINAUX pour rendre compte de l'avancement du projet. Travail sur le mot : PISTE
6 décembre 2007

Dernière étape : le contexte : le script !!!

Jeudi 6 décembre On s'approche de la version finale du script !Téléchargeable ici : script Et le résultat : test Il ne reste plus qu'à travailler sur la mise en page et à affiner la recherche de grep pour ne pas avoir un grand bloc de texte pas forcément...
26 décembre 2007

Cloture du projet

Mercredi 26 décembre Après la construction du site pour la présentation des résultats finaux, le projet touche à sa fin. Site visible ICI
31 octobre 2007

Modif

J'ai modifié le titre de la catégorie "mises au point" par "pistes de travail" !Un petit jeu de mots ^^Que je suis drôle !C'est ton mail qui m'y a fait penser ! AC
Publicité
Publicité
Publicité