Le web découpé en territoires

envoyer
par mail
imprimer
l'article
partager sur Viadeo
partager sur Facebook
partager sur LinkedIn
partager sur Scoopeo
partager sur Technorati
partager sur Digg
partager sur Delicious
partager sur Google
partager sur Myspace
partager sur Yahoo!

Qui influence qui sur le web ? D'où partent les buzz et comment se propagent-ils sur internet ? La start up RTGI tente de répondre à ces questions en “ développant des solutions technologiques de veille des médias sociaux, de suivi de l'influence et de la réputation en ligne ”, précise Guilhem Fouetillou, cofondateur de RTGI. Linkfluence, l'institut d'étude affilié à la start up, utilise ces outils pour écouter et analyser les médias sociaux. “ Notre moteur analyse la structure hypertextuelle des sites web pour comprendre l'organisation sociale des individus et la restituer sous forme de cartes ou de listes ”, poursuit Guilhem Fouetillou. Pour l'instant, RTGI a implémenté ses solutions pour ses clients au cas par cas, mais un portail plus générique, Linkspace, sera disponible début 2009 et adaptable à des cas particuliers.

Des filtres temporels et par territoire

Comme avec un moteur de recherche classique, le portail permet de faire des recherches sur le web, mais celles-ci sont restreintes à des sites considérés comme influents et actifs. “ Nos robots indexent quotidiennement plusieurs millions de sites, avec une moyenne de 50 pages par site ”, expose Guilhem Fouetillou. A l'issue, 6 000 sites sont retenus et surveillés, notamment parce qu'ils ont un grand nombre de liens avec d'autres sites. La méthode d'analyse de RTGI mélange modélisation mathématique, science des réseaux et sociologie. La théorie des graphes sert à comprendre quels sont les sites fortement liés entre eux. Les liens de pages à l'intérieur d'un même site sont éliminés. La technique de “ focus crawling ” est utilisée pour orienter le robot en fonction du contenu des pages. Elle donne la possibilité de suivre uniquement les liens valides et de se prémunir contre les techniques d'échange de liens. Seuls les sites qui ont des liens forts et centraux dans le graphe sont considérés comme pertinents.

Un moteur développé en Perl

Les sites web sont regroupés par centres d'intérêts communs et forment des communautés représentées par des territoires sur une carte. “ Les filtres utilisés pour lancer une requête peuvent être temporels, la recherche s'effectuant alors dans un laps de temps déterminé, mais aussi spatiaux, c'est-à-dire limités à un territoire particulier ”, détaille Guilhem Fouetillou. Une entreprise aura notamment la possibilité de suivre ce qui se dit sur l'un de ses produits sur un territoire en particulier.

Théoriquement, la carte devrait pouvoir évoluer quotidiennement. Mais, pour l'instant, la mise à jour s'effectue tous les trois mois. Et la start up vise à moyen terme un rafraîchissement mensuel. Il est à noter que le robot d'indexation est entièrement développé en Perl. “ La programmation est difficile avec ce langage, mais il est très performant pour traiter du contenu textuel en termes de rapidité ”, s'enthousiasme Guilhem Fouetillou.

Nom : RTGI.
Date de création : 2006.
Domaine : veille internet.
Innovation : cartographie de communautés web.
Produit : Linkspace.

Repères

Siège : Compiègne (60).
Effectif : 15 personnes réparties dans deux filiales RTGI Tech (développement) et Linkfluence (institut d'étude).
Financement : Oséo : 140 000 euros de subvention. Région Picardie. CA 2008 300 000 euros

Les quatre cofondateurs sont ingénieurs de l'Université de technologie Compiègne (UTC).
Guilhem Fouetillou : 28 ans, directeur général. DEA de sciences cognitives.
Alain le Berre : 28 ans, président.
Camille Maussang : 28 ans, directeur du développement. DEA en informatique.
Antonin Rohmer : 27 ans, directeur du design.

publicité
à lire aussi
SUR LES MÊMES THÈMES
System@tic organise un concours de start-up open source
Un SIG externalisé pour la gestion territoriale
Une analyse prédictive express des données clients
Optimiser la fiscalité des grands groupes
La haute définition sur un écran pas plus grand qu'un ongle
L'interactivité gagne les points de vente
Le web 2.0 s'immisce dans les ressources humaines
Mieux connaître son infrastructure et ses services télécoms
Valoriser l'information documentaire
L'e-commerce sécurisé jusqu'à la livraison
Un framework Python de nouvelle génération
Des cartes à puce plus résistantes
Reconnaître toutes les écritures à la volée
Du sans-fil entre station de base et antenne relais
La collaboration intelligente en milieu hospitalier
Le m-banking, successeur du e-banking
Analyser les flux réels pour améliorer la qualité des réseaux cellulaires
Des entretiens sous forme de questionnaires sans question
Surveiller à distance le système d'information