Pseudo-Weblog


Le grenier d'une maison est souvent assez petit. Quand il est plein, il faut passer par la douloureuse épreuve du tri dont le but est de ne garder que les choses "importantes". L'importance, dans ce cas, étant une notion très subjective. Une bibliothèque contient beaucoup plus de documents, mais est aussi limitée par leur taille. Il faut donc là aussi passer par des choix et ne garder qu'un nombre limité de documents.

Le Web (ou la Toile) n'a pas vraiment ces contraintes de place. Les disques durs contiennent de plus en plus de données, la perte d'information se fait plus par des pannes matérielles sur certains sites ne possédant pas de sauvegardes, ou par une action volontaire du créateur de contenu. Sur ce dernier point, il faut lire Cool URIs don't change. La capacité d'archivage étant de plus en plus grande, et grandissant à mesure des besoins, est donc virtuellement infinie.

Il est facile de se souvenir approximativement des objets formant le bric-à-brac du grenier. Il est un peu plus difficile de connaître l'ensemble des documents d'une bibliothèque, un simple catalogue peut aider, car il sert de base au souvenir des contenus. Dans le cas du Web, il est clairement impossible de tout connaitre (même les moteurs de recherche ne connaissent qu'une partie du Web), il est beaucoup plus dur de rechercher l'information, son existence n'est pas établie et la connaissance des documents n'est pas complète.

Faut-il réduire le nombre de documents sur le Web ? Qui devrait décider de la disparition de tel ou tel document, qui ne serait plus une "Cool URI" ? Et des raisons d'un tel choix ? (Surtout ne pas oublier d'utiliser une petite partie d'HTTP/1.1 assez méconnue, 410 Gone pour indiquer que la resource a existé) Ou faut-il améliorer la compréhension des resources du Web pour mieux y naviguer ?

C'est la seconde solution qui est à la base du Web Sémantique, qui travaille sur des ensembles de relations et propriétés. Malgré tous ces efforts, il sera impossible d'extraire une connaissance globale de documents complexes car ils peuvent avoir de multiples interprétations selon le lecteur, le contexte, etc. et la description de tels documents ne peut être qu'au mieux incomplète. Le rêve d'une Babel électronique va surement se transformer en une myriade de petites bibliothèques spécialisées, sous la responsabilité de petits groupes, cohabitant avec un grand espace dont la "valeur sémantique ajoutée" sera proche de zéro.


(c) 2002 Yves Lafon
Last edited: $Date: 2009-07-22 19:57:05 $