Encadrants:
- Roberto Di Cosmo et Alexandre Miquel
-
Université de Paris 7
http://www.dicosmo.org, E-mail: roberto@dicosmo.org
Tel: 01 44 27 86 55.
Laboratoires d'accueil:
PPS (Université de Paris 7).
Cadre de la recherche:
Ces dernières années ont vu un essor spectaculaire des technologies liées au
Web, et un accroissement exponentiel de l'information disponible en ligne.
En conséquence, les sites web d'intérêt général reçoivent désormais une
quantité de trafic imprévisible il y a quelques années, et il est devenu
important d'évaluer le flux des visiteurs d'un site, afin de mieux connaître
ce que les visiteurs aiment ou n'aiment pas, ou tout simplement pour savoir
d'où les visiteurs viennent, et vers ou ils partent.
Pour permettre de tracer plus facilement le parcours d'un visiteur sur un site
web, les versions actuelles du protocole HTTP prévoient un champs MIME
spécifique, qui est renseigné par tous les navigateurs lors de l'accès à
une page web, il s'appelle Http-Referer: et contient l'adresse de
la page web ou l'on a trouvé le lien qui conduit le visiteur sur la page
web demandée au serveur.
Ensuite, cette information est gardée dans des fichiers de log par le
serveur, et des outils comme webalizer l'analysent et permettent
d'obtenir un résumé des visites reçues.
Malheureusement, même sur des sites pas sponsorisés par des campagnes
publicitaires, il est facile d'obtenir des dizaines de milliers d'accès par
mois, ce qui rend désormais les résumés produits par les outils traditionnels
fort peu pertinents.
Idéalement, on aimerait pouvoir visualiser le faisceaux
des accès au site web par un graphe dont les noeuds sont les pages du serveur,
et les arêtes ont une taille proportionnel au nombre de visiteur qui sont passés
entre ces deux pages, mais même pour un site comme
http://www.demolinux.org, ce graphe, affiché par le moyens
conventionnels, comme webdot, occuperait plusieurs dizaines de mètres
carrés de papier, si on devait l'imprimer de façon à pouvoir lire les caractère présents sur le graphe.
Le but de ce stage est d'expérimenter avec Ocaml et la géométrie hyperbolique
pour afficher ces graphes d'accès de façon beaucoup plus efficace.
On vous fournira les informations de base sur la représentation hyperbolique,
ainsi que du code pour afficher des arbres sur le plan hyperbolique, et on vous
demandera de parser un fichier de log, construire le graphe correspondant en mémoire, et explorer les différents mouvement hyperboliques possibles pour rendre la visualisation du trajet des visiteurs intéressant.
This document was translated from LATEX by HEVEA.