Archives par mot-clé : Web sémantique

Le web de données

Récemment s’est terminé le MOOC sur le Web sémantique et de données, conduit par l’INRIA. Sept semaines denses et riches en connaissances.

La première semaine était consacrée au « web de données liées ». Comme pour toute introduction sur un sujet donné, il est bien de revenir au passé pour comprendre le présent. Nous avons donc eu un retour sur l’histoire du web :

  • Vannevar Bush (1890-1974) : son article « As we may think »  décrit quelque chose qui ressemble beaucoup au World Wide Web d’aujourd’hui. Il imagine le memex (memory extension) pour lire et consulter des documents et faire des liens d’association entre eux. cf la version en français de son article.
Memex, Life Magazine, 10 septembre 1945

 

  • Ted Nelson : Utilisera le memex et proposera une structure de fichiers qui permettra de découper les fichiers en morceaux, de les relier entre eux afin de pouvoir naviguer entre les morceaux. On parlera d’hypertexte et d’hypermedia.
Complex information processing: a file structure for the complex, the changing and the indeterminate, T. H. Nelson, ACM, 1965

 

  • Tim Berners-Lee : Permettra à ce qu’on n’utilise plus l’hypertexte sur une seule machine. On distribue les documents sur le réseau de façon à ce qu’un document puisse pointer vers un autre document. On parlera de Web.  cf le rapport de Tim Berners-Lee à ce sujet.
Information Management: A Proposal. Tim Berners-Lee, CERN, March 1989, May 1990

 

Ensuite, petit retour sur les 3 principes architecturaux du Web. Le premier principe, celui de l’identification ou de la localisation avec ce que l’on appelle les adresses Web ou URL.

Le second principe, celui du protocole, c’est-à-dire la façon dont les machines vont parler sur le Web, la façon dont le navigateur interrogera le serveur à distance et recevoir une représentation de la page qu’il a demandée. Ce protocole s’appelle HTTP.

Enfin, le dernier principe est le langage de représentation et notamment le langage de représentation des pages du Web. On l’appelle HTML (Hypertext Markup Langage).

Mis ensemble, chacun de ces composants va interagir avec l’autre. Le protocole HTTP utilise l’HTML pour faire transiter sur le Web des représentations de pages entre le serveur et ne navigateur. Les URL sont utilisées dans le HTML dans les représentations des pages pour tisser les liens entre les pages et indiquer que dans une page, un lien pointe vers une autre page. Ces mêmes URL qui sont utilisées par HTTP pour identifier et s’adresser à distance au serveur afin de récupérer la page dont il a besoin.

Focus ensuite sur le processus de standardisation au W3C, nécessaire pour harmoniser les évolutions du Web et qui suit des étapes bien définies.

Enfin, cette première semaine s’est terminée sur les grands principes du web de données :

  • nommer les ressources avec des URI (Uniform Resource Identifier) ;
  • utiliser des URI http (ou URI déréférençables) de façon à ce qu’on puisse utiliser ces URI pour accéder à des informations sur les ressources ;
  • lorsqu’on déréférence une URI, renvoyer des informations utiles grâce à RDF et SPARQL ;
  • se relier avec d’autres URI pour créer un réseau de liens.

En définissant ainsi la notion de ressource Web en passant des URL aux URI, nous avons vu comment l’on pouvait maintenant identifier tout type d’information sur le Web.

Nous avons pu alors poser les principes de la publication de données liées sur le Web et introduire la pile des standards du Web sémantique

En savoir plus :

Quelques ressources fondatrices du web de données :

  • DBpedia, base issue de la conversion en RDF des données de l’encyclopédie collaborative Wikipedia ;
  • Geonames, l’une des principales bases de noms de lieux avec les informations associées ;
  • MusicBrainz, base d’informations en RDF sur les œuvres et les artistes musicaux.

Du Web des documents au Web sémantique

Fonctionnement et enjeux du Web des données et du Web sémantique

Voici un bon ouvrage pédagogique sur le fonctionnement et les enjeux du Web des données et du Web sémantique. Indispensable si vous souhaitez acquérir plus de connaissances sur le Web des données. Ce livre m’a beaucoup aidée récemment pour le MOOC sur le Web sémantique créé par l’INRIA.

L’ouvrage a pour objectif de présenter les modèles, langages et techniques proposés par le Web des données et le Web sémantique. Après un rappel historique sur le Web des documents, il aborde de manière détaillée et approfondie le concept des métadonnées.

« Si nous sommes capables d’utiliser le Web pour effectuer des requêtes simples, c’est à nous qu’il revient cependant de manipuler les données, de les combiner et de les interpréter pour qu’elles se transforment en informations pertinentes. Le Web des documents reste donc principalement réservé à l’humain, la machine n’étant pas en mesure de le remplacer efficacement. Nous sommes cependant à la naissance du Web 3.0 qui porte le Web des documents vers le Web sémantique et permet aux machines d’analyser le Web pour répondre à des questions plus complexes posées par l’homme. ».

Du Web des documents au Web sémantique, Nicolas Delestre, Nicolas Malandain (Janvier 2017).