|
||||||
|
LE CONTEXTE
La dixième édition de la World Wide Web Conference s'est tenue début mai à Hong Kong. Un événement au cours duquel il a beaucoup été question de web sémantique.
![]()
Eric Van der Vlist, auteur du site d'information sur XML Xmlfr. org et membre du groupe de travail RSS ( RDF Site Summary), s'y est rendu. Il livre ici les dernières avancées du W3C en la matière et confirme la controverse dont le langage
RDF fait l'objet.
Lors de la dernière grand-messe du W3C, l'inventeur du web, Tim Berners-Lee, a affirmé, une nouvelle fois, sa vision d'un web sémantique lors de la session inaugurale. Devient-il urgent de donner du sens au web ?
Aujourd'hui, nous naviguons sur un web simple, composé de pages au format HTML, transitant sur le protocole HTTP. Cet espace de contenus a été créé pour que l'homme puisse les consommer facilement. Or, le nombre de pages est devenu si important qu'il est bien difficile de ne pas se perdre dans ce gisement d'informations. Pour interpréter les contenus du web, nous parvenons à un stade où les machines doivent impérativement venir au secours de l'homme. Cette interprétation des ressources du web par des machines implique trois prérequis: un codage universel des caractères - en l'occurrence, Unicode -, une structure standard de documents - XML est bien parti pour répondre à ce besoin - et une définition du sens des documents. Le développement de ce troisième point conduit au web sémantique.
Ce concept a-t-il un rapport avec la notion de métadonnées ? Et s'appuie-t-il sur les standards XML recommandés par le W3C, comme XML Schema ?
Pour matérialiser sa vision, et plutôt que XML Schema, Tim Berners-Lee promet, pour l'heure, un langage conforme au formalisme XML, baptisé RDF (Resource Description Framework). Sa spécification, en version 1. 0, existe depuis maintenant près de deux ans. RDF fournit les métadonnées d'un document. Son but est d'exprimer des faits - par exemple, "le ciel est bleu". RDF exprime ces descriptions sous la forme de graphes complexes. Ce langage s'appuie sur des « triplets », formés de l'identifiant de la ressource décrite (Resource), de sa propriété (Property) et de sa valeur (Value). Un identifiant URI (Uniform Resource Identifier) sera, bien sûr, donné à chaque page du web, mais aussi à tout élément d'un fait inclus dans un document XML. Dans l'exemple "le ciel est bleu", "ciel", "est", le verbe être, et "bleu", la couleur, seront chacun associés à un URI.
Le W3C s'intéresse-t-il officiellement au web sémantique ?
Il s'y intéresse, mais depuis peu de temps. L'activité "semantic web"(1) a été lancée en février 2001. Dans ce cadre, le W3C alloue des ressources pour donner suite aux travaux déjà menés, cette activité succédant à celle consacrée aux métadonnées. Un nouveau groupe de travail, RDF Core, a été créé à cette occasion. Il reprendra en particulier les recherches effectuées par le précédent groupe, RDF Interest. Le consortium du web n'est pas le seul à marquer son intérêt pour cette notion. La Commission européenne vient, en effet, d'annoncer qu'elle publiera en juin 2001 une nouvelle ligne d'action en rapport avec le web sémantique, fondée sur les conclusions de l'atelier Semantic Web Technologies Workshop(2). Les réflexions porteront sur la structure du contenu numérique et la définition de son sens, l'extraction des attributs sémantiques d'un contenu, la recherche et le filtrage des connaissances, ainsi que sur le développement d'interfaces visuelles intelligentes faisant appel à des structures sémantiques. Cette initiative de l'Union européenne n'a d'autre but que de faire prendre conscience aux industriels européens des besoins engendrés par cette nouvelle étape du world wide web.
RDF est-il unanimement accepté ?
Si ce langage a bénéficié d'un bon accueil dans le milieu universitaire, il ne semble pas emporter les faveurs de l'industrie. RDF fait l'objet d'une sérieuse controverse. Les experts des systèmes de gestion de la connaissance jugent d'abord que la problématique de leur domaine est trop ardue pour être résolue par une proposition aussi simple. RDF est aussi discuté par les industriels, qui préfèrent axer leurs efforts sur un secteur qu'ils jugent plus utile, à savoir les échanges collaboratifs du commerce électronique. A ce titre, la réputation de complexité de RDF a effrayé l'organisme Oasis, qui a préféré ne pas retenir ce langage dans l'élaboration de sa spécification ebXML. Du coup, on se retrouve actuellement devant deux types de web sémantique - le premier lié aux contenus documentaires, le second aux services de commerce électronique. Avant d'être invoqués, ces services doivent, en effet, être convenablement identifiés. Cela relève des récentes technologies XML que sont Soap, le protocole XML, WSDL, le standard de description de ces services, et UDDI, l'annuaire universel qui stocke leur référence. Qu'il émane de l'e-commerce ou du monde documentaire, le web sémantique verra le jour, avec ou sans RDF.
Que manque-t-il à RDF pour qu'il se répande ?
Des applications! Le W3C l'a bien compris. Il a ainsi lancé l'application Annotea, qui repose sur RDF et permet aux lecteurs d'une page de rédiger leurs propres annotations. Les vocabulaires créés à partir de RDF ne sont pas encore légion. Dublin Core, qui commence à faire référence, permet de définir un mécanisme de classification de documents. Il en existe deux versions -l'une fondée sur les balises "Méta" de HTML, l'autre sur le langage RDF. RSS (RDF Site Summary) constitue une autre technologie largement utilisée par des sites portails, comme Userland, Meerkat ou Moreover, pour la syndication de titres. Ce vocabulaire RDF fut inventé par Netscape pour syndiquer les titres des informations publiées sur le portail my. netscape. La structure du site d'actualités du monde XML Xmlfr. org est représentée par une série de documents RSS 1. 0, dont les informations de classification taxonomique sont extraites des balises sémantiques présentes dans les articles et décrites au moyen du module "taxonomie", récemment intégré à la version 1.0 de RSS.
(1) :
www.w3.org/2001/sw/
![]()
(2) :
www.cordis.lu/ist/ka3/iaf/swt_ presentations/swt_presentations.htm
Donner du sens aux innombrables contenus disséminés sur internet : telle est la quintessence de la vision d'un web sémantique imaginé par Tim Berners-Lee. Pour l'heure, l'avenir de ce concept tout juste émergent semble lié à l'acceptation du langage nommé RDF.
Le chemin sera long avant qu'il ne soit reconnu par tous. Et il devra d'abord s'enrichir de technologies complémentaires. Manquent aujourd'hui cruellement un analyseur de syntaxe (parser) RDF, un standard de description RDF Schema et un langage d'interrogation des triplets RDF.
![]() |
Photo
Canon EOS-450D. Reflex 12.2 Megapixels. Comparez les prix !
|
|
![]() |
> Logiciel :
Video Converter Conversion audio et vidéo.
|
|
1 Numericable
2 Orange
3 Darty
> Plus de détails

![]() |
Compacts Numériques
Lumix DMC-TZ5 Noir Panasonic. Comparez les prix !
|
|
