SemanticPedia, DBpedia et la philosophie du Web : mini-manifeste pour un programme de recherche à venir – retour sur une table-ronde fantôme…

La vidéo de la journée de présentation de SemanticPedia, enregistrée par les soins de l’IRI, sera bientôt publiée. Il manque cependant la dernière table-ronde que j’animais en raison des limitations propres à Ustream. Quelques mots, donc, pour combler cette absence à destination de celles et ceux qui n’on pu assister à la dernière heure, sous la forme d’une courte réflexion qui ne mérite pas le nom de manifeste. Mini-manifeste est déjà prétentieux (plus facile à assumer cependant).

Tommaso Venturini du Médialab de Sciences Po est revenu le premier sur l’analyse des controverses pour en faire une présentation succincte. J’ai pris la parole à sa suite pour souligner l’importance que revêt à mes yeux un projet comme DBpedia dans la perspective du Web, du Web de données et de la philosophie du Web – importance qui a motivé mon engagement dès son origine.

Loin de ne voir dans Wikipédia qu’une simple encyclopédie et DBpedia une base de connaissances trivialement extraite à partir de la première (ce dernier point étant techniquement indéniable), il m’apparaît bien plutôt que le couple Wikipédia/DBpedia, car je préfère désormais lier leurs destins, si représentatif de deux Webs souvent opposés l’un à l’autre, un Web de documents et un Web d’objets, pose une question tout à fait différente : dans quel monde commun vivons-nous ? Il s’agit, en d’autres termes, de déterminer les entités qui le com-pose et le travail nécessaire pour bâtir et négocier un univers partagé. Attention cependant, il ne saurait être question de mettre en avant le consensus des opinions comme valeur absolue, on ne négocie pas à ce niveau-là. L’épistémologie officielle de Wikipédia, des plus rigoureuses, ne le permettrait d’ailleurs aucunement. Elle suppose en effet d’associer à tout propos la référence, traçable, qui lui correspond, et ce sous peine de courir le risque d’être effacé. Le caractère public, donc publiées, des “sources secondaires” (en d’autres termes, “à caractère factuel”) lui est donc consubstantiel. C’est sur ce dernier que repose la discussion, celle-là même qui nourrit les pages dédiées qui accompagnent chaque article en vertu des spécificités du logiciel Mediawiki. En tant que “source tertiaire” auto-proclamée (rassemblement de sources secondaires – ce qui, du reste, est contestable), Wikipédia repose en définitive sur la mobilisation de porte-paroles (à la mode de l’acteur-réseaux), de préférence puisés dans la(es) littérature(s) scientifique(s). Les conditions d’accès à celle(s)-ci sont donc cruciales pour participer à l’oeuvre collective. Compte alors autant l’accès aux contenu des sciences en tant que disciplines qu’à leur publications, par-delà les politiques restrictives de certains grands éditeurs. Tout est ainsi mis en oeuvre pour que l’on ne débatte pas d’opinions sur Wikipédia mais bien, en dernier ressort, de l’établissement des faits. Pour autant, le fait n’est pas ce que l’on rencontre immédiatement, il n’est pas donné. Sa “construction”, selon une métaphore qui a longtemps charriée avec elle une foultitude de malentendus, entraîne un coût parfois prohibitif et des efforts incessants (précisément ce dont ne rend guère compte un constructivisme social ayant suffisamment rompu les amarres avec le réalisme pour vider la métaphore de sa substance).

En tant que rassemblement de faits tirés de la littérature scientifique qu’elles fait converger – et parfois diverger, observons les scientifiques eux-mêmes !, Wikipédia s’apparente à une forge de faits et d’objets, rassemblés après extraction à partir des infoboxes (qui, elles-mêmes, ne contiennent que des informations “factuelles”), dans DBpédia. Cela étant, on ne saurait penser DBpédia comme un produit fini, une évolution du “Web 3.0” dont Wikipédia serait l’étape aussi préliminaire que dispensable. Au contraire, il convient, pour avancer, d’enter résolument, au préalable, les entités de DBpédia sur la contribution incessante qui se déploie au sein de Wikipédia. Autrement dit, déployer un nouveau régime des objets (et de l’objectivité, une “objectité de second degré”, selon l’expression de T. Venturini, ancrée dans la controverse et le rassemblement virtuel des objecteurs), comme nous y invite le Web et son architecture. Non plus des objets stables ou pré-individués, nullement des “ready-made objects”, mais des objets dont l’individuation présente un coût certain ; des objets vulnérables, controversés, provisionnels. Et pour certains, exclus du collectif, à l’instar du “savoir indigène”, dont la notice fut un beau jour remplacée, comme le rapporte Maja Van der Velden (Critical Point of View. A Wikipedia Reader, p. 246), par le “savoir traditionnel”, expression utilisée par les juristes pour désigner le caractère brevetable des savoirs… autrefois indigènes. Ascendant pris par une notice sur une autre en amont, ascendant pris par une entité sur une autre, d’une itération de DBpedia à la suivante, d’un état du collectif à t0 à l’état de ce “même” collectif à t+1. Comment ne pas voir dans ces décisions et les luttes qui s’y rattachent, dans cette “politique de l’exclusion” (titre de l’article de Van der Velden) et dans les filets tendus pour rattraper ses victimes, contre lesquels le collectif se déploie ponctuellement, un ressort fondamental de la Constitution théorisée voici plus de dix ans par Bruno Latour dans ses Politiques de la Nature, et aujourd’hui en partie réalisée sur une échelle globale, au croisement du Web, plus grand artefact informationnel connu à ce jour, et de Wikipédia, plus grande encyclopédie de l’Histoire ? Ces questions touchent autant à la métaphysique (et l’on songe ici tout particulièrement à la “métaphysique participative” de Brian Cantwell Smith, qui fut notre invité cette année à l’occasion de la première séance du séminaire philosophie du Web) qu’à la politique et à la technique. Les architectes du Web ne définissent-ils pas la ressource comme “n’importe quoi”. Telle est la puissance du Web, nous permettre de parler de n’importe quoi (de tout, en somme, et plus encore). C’est précisément à ce niveau fondamental qu’il convient de penser la place de Wikipedia/DBpedia. Est-ce un hasard si leur centralité est attestée, au coeur du Web “traditionnel” aussi bien que du Web de données ? “N’importe qui peut dire n’importe quoi à propos de n’importe quoi”, tel est le mot d’ordre. Mais où s’opère la confrontation ? Où tenir compte des faits récalcitrants et de ceux qui les portent ? Où les dé-faire, également ? Sur une échelle globale et dans 285 langues… ?

Bien sûr, tout cela suppose d’ouvrir une réflexion sur l’établissement des sources mobilisées comme matériau de base de cette Constitution en acte. Les conditions d’accès à celles-ci de même que les possibilités d’influer sur le processus de publication scientifique constituent dès lors un enjeu essentiel. La sociologie a depuis plusieurs années maintenant analysé en profondeur le rôle croissant joué par des acteurs de plus en plus divers, à l’instar des associations, dans le pilotage de la recherche. Sans oublier les signalements épidémiologiques ou encore les dispositifs numérique de participation à l’effort de la recherche, médiés et médiatisés par des interfaces ludiques telles Foldit : le public a son mot à dire. En ce sens, et paradoxalement , une partie de la production scientifiques, la plus orientée sur son versant contributif, est sans doute en avance sur Wikipédia du point de vue de traitement des sources. A terme, une réflexion est donc à entreprendre pour permettre à davantage de voix de s’exprimer sur Wikipédia/DBpedia, tout en conservant les règles qui, jusqu’à présent, ont largement préservé l’encyclopédie du bavardage trivial et du pur et simple échange d’opinions, au risque d’exclusions nettement plus gênantes parfois…

Pour toutes ces raisons, il m’apparaît urgent d’opérer une convergences entre le Web de données qui se déploit sous nos yeux, Wikipédia, plate-forme contributive par excellence, et l’analyse des controverses, dont le rôle stratégique, dans la perspective de l’établissement d’un univers partagé, n’est plus à démontrer. Tommaso Ventunini a exposé de nombreuses pistes de recherche très prometteuses allant dans cette direction. Au plan technique, des ponts existent déjà, à l’instar du SemanticWebImport, présenté par Julien Cojan et développé au sein de l’équipe Wimmics, qui constitue une passerelle entre le logiciel Gephi, initialement développé pour la visualisation de graphes dans la perspective de l’analyse des controverses, et les formats du Web de données. C’est également à cet effort qu’entend contribuer le projet WikisocialEdits de sémantisation des actes d’éditions de Wikipédia auquel je m’attellerai en début d’année prochaine.

A son tour, Joëlle Zask (Université de Provence) a pris la parole en conclusion de cette journée répondant ainsi très aimablement à l’invitation que je lui avait lancée d’intervenir sur deux questions qui vont de pair selon moi : l’inter-objectivation et l’individuation (au sens de Dewey ou Simondon cette fois). Si l’objectivation est une oeuvre collective et non le rapport d’un sujet de la connaissance à “son” objet, l’individuation en est le complément naturel dans l’optique participative en vigueur sur Wikipédia. Le travail de construction ou d’établissement des objets, oeuvre collective, me construit. En individuant les objets d’un monde forcément partagé (au moins a minima), je m’individue à mon tour. Il faut pour cela renoncer à deux tentations : d’une part, comme l’indiquait J.Zask, Babel et ses objets stables, prêts à l’emploi, gages de certitude absolue, à même de faire cesser la discussion une fois découverts, et d’autre part, la primauté du consensus, l’intersubjectivité comme accord des seules consciences, insoucieuses des réalités.

Une remarque enfin, pour finir. La même qu’il y a deux jours. D’aucuns pourront s’en émouvoir mais je note que J. Zask, au cours de son intervention, a signalé à quel point, à ses yeux, le pluralisme avait imprégné les discussions de cette journée. Chose étonnant, dis-je, pour un événement traitant du Web sémantique, dont la similarité avec l’anneau unique (“one ring to rule them all“) n’a cessé, longtemps, d’être soulignée. A tort ou raison. Quoi qu’il en soit, ce n’est sans doute pas le fruit du hasard s’il fallut attendre 2006 et une note de Tim Berners-Lee pour repenser le Web Sémantique sous les auspices d’un Web de données tout entier tendu vers la publication, pierre de touche du Web, et si, à peu près à la même époque, naquit DBpedia. On peut voir dans la convergence entre les deux un double effet d’aubaine : se parer du sérieux (en apparence excessif) de la sémantisation pour une encyclopédie trop anarchique pour être fréquentable, ; plonger dans la controverse et ses objets instables pour un projet supposément trop ancré dans l’héritage de l’intelligence artificielle et pas assez dans ce qui constitue son assise : le Web, ses valeurs, son architecture et sa philosophie (vous voyez peut-être de qui(s) je parle).

Et si la dette, mutuelle, était enfin apurée ?