Passer au contenu

Haystack : le Web sémantique sur son bureau

Pour gérer toutes les informations personnelles stockées ou arrivant sur un ordinateur, une équipe du MIT développe un outil gratuit étonnant reposant sur les principes du Web sémantique. D’une conception remarquable, mais
d’une lenteur encore affolante.

C’est un ovni technologique, une manière concrète, personnelle, de toucher enfin du doigt ce fameux
Web sémantique que l’on encense sans jamais pouvoir le saisir.
Haystack est un logiciel gratuit, développé en Java par une équipe du MIT, qui vise à fédérer toutes les informations personnelles éparpillées sur un ordinateur, quelle que soit leur nature
(e-mails, documents, contacts, rendez-vous…), à les présenter au sein d’une interface unique et personnalisable, tout en facilitant la manipulation de ces données. Une version avancée sera présentée au cours de la prochaine conférence
internationale sur le Web sémantique (ISWC2003), qui aura lieu du 20 au 23 octobre en Floride.Vu de loin, Haystack pourrait ressembler à une sorte d’Outlook. Il est en effet capable de relier sous une même bannière des données de type agenda, carnet d’adresses, gestion de courrier électronique et même messagerie
instantanée. Mais il est beaucoup plus que cela.

Un projet initié en 1997

La force d’Haystack, c’est d’abord de décrire chaque document qui lui est soumis en utilisant le
RDF (Resource Description Framework), un système ouvert développé, depuis 1997, par le World Wide Web Consortium. Par exemple, l’auteur, le titre, la date de publication d’un texte
pourront être intégrés au document sous forme de métadonnées (Title :’ The future of Metadata ‘, Creator : ‘ Jacky Crystal ‘, Date : ‘ 1998-01-01 ‘).Haystack vise donc dans un premier temps à reconnaître ou à associer des métadonnées à des documents. Ces dernières peuvent bien sûr être partagées par plusieurs ‘ services ‘ (messagerie, agenda, carnet
dadresses, etc). Ainsi, l’expéditeur d’un mail correspondra à une entrée du carnet d’adresses et sera associé à un rendez-vous dans l’agenda, voire identifié comme l’auteur d’un fichier stocké sur le disque
dur ou d’une page Web donnée. Haystack est capable de mettre en concordance des métadonnées disparates en constituant une base de données unique respectant le RDF.L’équipe dirigée par le professeur David R. Karger, et qui travaille sur le projet depuis 1997, a par ailleurs développé son propre langage, Adenine, pour manipuler ces métadonnées. Une sorte de combinaison de
Python et de
Lisp sur laquelle reposent toutes les actions réalisables par l’utilisateur. Grâce à Adenine, un clic droit sur le nom de l’expéditeur d’un mail affichera toutes les actions
potentiellement associées à un nom : inviter à une discussion instantanée, ajouter au carnet d’adresses, lui attribuer une catégorie (‘ auteur ‘, ‘ parent ‘ ou
‘ collègue ‘, etc.).Contrairement à Outlook, la liste des actions possibles est la même, quel que soit le service utilisé, et est organisée par grands thèmes (action sur la personne, action sur le document, etc.). L’autre différence majeure avec
Outlook réside dans le fait que le système de métadonnées (RDF) et de leur manipulation (Adenine) est totalement ouvert.

Un espace de travail complètement personnalisable

La dernière brique de Haystack est constituée par son interface graphique, appelée Ozone. Elle pilote une mise en page très souple des données décrites au format RDF. Le service de type ‘ gestionnaire de
mails ‘ dispose de son propre emballage, qui sera différent de celui du service agenda. Chaque type de données, chaque service peut ainsi être enrobé selon un modèle préétabli ou personnalisé par l’utilisateur.Plus subtil, ce dernier peut positionner chaque service où bon lui semble sur la surface de travail d’Haystack. Une sorte de MyYahoo, au sein duquel cohabitent aussi bien des données personnelles que des fils d’actualités,
des cours de Bourse ou la météo.Encore en cours de développement, la deuxième version de test, mise en ligne le 20 août, se révèle beaucoup plus stable que la précédente. Mais elle souffre de deux handicaps majeurs.D’abord, une lenteur considérable. ‘ Après avoir posé toutes les bases conceptuelles, c’est le défi que nous nous sommes assigné, explique Dennis Quan, l’un des développeurs.
Mais elle est déjà deux fois plus rapide que la précédente version, sortie en juin. ‘Deuxième handicap : sa gourmandise affolante. Pour faire fonctionner Haystack, les concepteurs conseillent d’utiliser au strict minimum un Pentium III cadencé à 700 MHz et équipé d’au moins 512 Mo de
Ram : ‘ Ça, je doute que nous pourrons descendre plus bas ‘, reconnaît Dennis. Sans compter l’installation de l’indispensable
Java 2 Standard Development Kit, l’application qui doit être installée à la racine du disque principal et occupe plus de 300 Mo .

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Serge Courrier